Les entreprises technologiques semblent entraîner illégalement l’IA avec des images de fabricants néerlandais

Cet article a été mis à jour pour la dernière fois le août 6, 2024

Les entreprises technologiques semblent entraîner illégalement l’IA avec des images de fabricants néerlandais

training AI with images

Les entreprises technologiques semblent entraîner illégalement l’IA avec des images de fabricants néerlandais

Il apparaît clairement que les modèles d’IA d’OpenAI et de Midjourney permettant de générer des images sans autorisation ont été formés avec des images de créateurs néerlandais. Cela ressort clairement des recherches menées par le NOS et est confirmé par quatre experts. Ce faisant, les entreprises technologiques pourraient avoir violé le droit d’auteur.

OpenAI n’a pas voulu réagir sur le fond à l’étude, mais a évoqué, entre autres, la possibilité pour les créateurs d’images de s’y opposer. Midjourney n’a pas répondu à nos questions.

Robe jaune

Pour la recherche, nous avons demandé aux modèles d’IA de générer des images dans le style de divers créateurs d’images néerlandais bien connus, notamment Erwin Olaf, Eddy van Wessel et Dick Bruna. Nous avons seulement demandé à imiter le style, sans autre instruction.

Des traits caractéristiques d’œuvres connues ressortent à chaque fois. Par exemple, les modèles d’IA ont généré des images de femmes dans une robe jaune, comme dans une série de photos d’Erwin Olaf.

Dans le cas d’Eddy van Wessel, des images en noir et blanc de zones de guerre ont été créées, scènes pour lesquelles le photographe est connu. Des images de Miffy ont également été générées lorsque nous avons demandé une image dans le style de Dick Bruna. Les titulaires des droits de Bruna n’autorisent pas l’utilisation de ces images dans cet article.

Notamment, la création d’images dans le style de certains artistes avec DALL-E d’OpenAI (la société derrière ChatGPT) est parfois rejetée car elle viole leurs conditions. Cependant, en réessayant dans un autre onglet, cela fonctionne souvent.

Le NOS a présenté les résultats à quatre experts dans le domaine de l’IA : Evangelos Kanoulas et Efstratios Gavves de l’Université d’Amsterdam, Olya Kudina de la TU Delft et Noelle Cicilia de Brush AI. Ils disent tous que même si cela ne peut pas être dit avec une certitude à 100 %, il apparaît très clairement que les modèles d’IA ont été formés sur les œuvres néerlandaises.

« Il s’agit d’une description très générique », explique Kanoulas de l’UvA. « Pourtant, les modèles d’IA sont capables d’établir une association avec, par exemple, une robe jaune en se basant uniquement sur le nom de quelqu’un. »

Cicilia souligne qu’un modèle d’IA n’est pas créatif en soi. « Les modèles d’IA générative tentent simplement d’imiter ou de reproduire aussi fidèlement que possible les données sur lesquelles ils sont formés. »

« Si les œuvres sont protégées, la violation du droit d’auteur est généralement rapidement présumée si quelqu’un s’enfuit », explique Mirjam Elferink, avocate en propriété intellectuelle chez Elferink & Kortier.

Mais il existe une exception pour la collecte de données publiques, explique Elferink. Cette exception s’applique, par exemple, aux institutions scientifiques. Mais les acteurs commerciaux peuvent également y recourir tant que les titulaires de droits ne s’y sont pas explicitement opposés : c’est ce que l’on appelle l’opt-out.

Une telle option de non-participation a été utilisée pour les œuvres de Dick Bruna et Eddy van Wessel, ce qui peut constituer une violation du droit d’auteur. Ce n’est pas le cas d’Erwin Olaf, explique Shirley den Hartog, qui dirige désormais son œuvre : « Nous avions discuté avant sa mort du fait que ce serait très bien si des gens du monde entier continuaient à s’impliquer dans son travail. »

Pas à jour

« Il est bon de savoir que l’exception au droit d’auteur a été introduite dans la loi avant que ces outils d’IA ne deviennent accessibles au public », explique l’avocat Elferink. Selon elle, cela conduit désormais à une incertitude quant à son application à la formation de modèles d’IA.

« Il est dommage qu’il n’y ait pas encore eu de procès aux Pays-Bas à ce sujet, le juge n’a donc pas encore pu se prononcer sur cette question. » Il y a plusieurs poursuites contre cela aux États-Unis OpenAI comme À mi-parcours. Il n’y a pas encore de déclarations.

Hanneke Holthuis, avocate de l’organisation de défense des droits à l’image Pictoright, affirme que de nombreux créateurs d’images ne connaissent pas cette « torsion du droit d’auteur ». Selon elle, personne n’avait pris en compte le fait que les modèles d’IA seraient soudainement entraînés avec des œuvres accessibles au public : « On ne peut pas s’attendre à ce que quelqu’un fasse une réservation pour quelque chose qui n’existe pas encore à ce moment-là. »

Se désengager

La loi européenne sur l’IA, en vigueur depuis ce mois-ci, semble s’inscrire dans le droit fil du système d’opt-out. Les créateurs d’images doivent indiquer qu’ils souhaitent utiliser leur droit de non-participation, les entreprises technologiques doivent alors être transparentes sur la manière dont les modèles sont formés et pouvoir démontrer qu’elles ne violent pas le droit d’auteur.

Le problème avec l’opt-out est qu’il doit être appliqué avant que l’IA ne soit formée à faire le travail, explique Holthuis. « Une fois formé, il est difficile pour un système d’IA de « désapprendre » des données spécifiques. Cela signifie que les œuvres qui n’ont pas été publiées dans le cadre d’un opt-out avant la formation de l’IA peuvent avoir été utilisées de manière irréversible. Les créateurs d’images néerlandais sont les bienvenus optoutnow.ai indiquer qu’ils souhaitent exercer leur droit d’opt-out.

entraîner l’IA avec des images

Partager avec des amis

Soyez le premier à commenter

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée.


*