Morceaux de musique, tableaux, voix, style, rythme… Qu’est-ce-qui échappe encore aux intelligences artificielles (IA) génératives lorsqu’elles sont « entraînées » et qu’elles ingurgitent des milliards de données collectées sur le Web ? Le « datascrapping » (en français, le fait d’aspirer des données) est tel que des artistes préfèrent désormais ne plus rien mettre en ligne, par crainte de voir leur art ou leur style copié et imité à la perfection par un des systèmes d’IA, ces outils qui permettent de générer du texte, du code, de la musique, des voix ou des images.
Cette solution radicale est-elle justifiée ? Le droit d’auteur ne protège-t-il pas justement les artistes et titulaires de droit de telles extrémités ? Contrairement à ce qu’on pourrait penser, la loi, face à l’IA, n’est pas du côté des auteurs, du moins pour l’instant.
Les artistes démunis face à l’IA ?
Et c’est justement pour prouver le contraire qu’une poignée d’artistes et d’ayants droit ont entamé des actions judiciaires contre des entreprises d’IA génératives d’images, aux États-Unis et au Royaume-Uni. Getty Images, une plateforme de photographies protégées par le droit d’auteur, s’est par exemple aperçue que ses images avaient servi à entraîner Stable Diffusion, sans son autorisation.
Ce système d’IA aurait pillé en masse ses photographies, estime cette société qui a porté plainte en février dernier. Un mois plus tôt, trois artistes ont attaqué la même Stable Diffusion, mais aussi ses concurrentes Midjourney et DeviantArt. La raison, identique : des milliards d’images ont été collectés en vue de « l’apprentissage » de ces IA, y compris pour les créations protégées par le droit d’auteur.
Au sein de l’Union européenne, certains vont plus loin en demandant directement au législateur de changer le droit qui, selon eux, ne protégerait pas assez les artistes face à l’IA. Dernière initiative en date, celle de l’UVA (« United Voice Artists »), une organisation qui réunit syndicats et associations des comédiens de voix off de films, séries et animations de nombreux pays – dont la France. Le 24 mai dernier, cette association a adressé un manifeste aux décideurs européens demandant, entre autres, de changer les règles du jeu, inquiète des capacités de l’IA à cloner de très nombreuses voix. Cette dernière souhaite que les collectes de voix à des fins d’entraînements soient préalablement autorisées et contractualisées – contre rémunération. Même chose pour tout clonage de voix, qui doit faire l’objet d’un contrat en bonne et due forme avec la personne concernée, ajoute-t-elle.
Oui, l’IA peut scrapper des œuvres protégées
Car, contrairement à ce qu’on pourrait penser, l’IA peut, dans certains pays, collecter en toute légalité des œuvres protégées pour s’entraîner. C’est le cas en Europe, où la directive sur le droit d’auteur de 2019 – transposée en France et donc applicable dans l’Hexagone – prévoit justement ce cas particulier. Normalement, le droit d’auteur empêche toute utilisation d’une œuvre, sauf autorisation du créateur ou de son ayant droit. Une société ne pourra pas, par exemple, reprendre un morceau des Beatles pour une publicité sans l’accord de ses ayants droit et sans le paiement de quelques royalties salés. Mais il existe des exceptions, et cette directive en a prévu une : l’exception dite de « text and data mining » (le droit de fouilles, en français). Elle vise expressément les systèmes d’IA qui collectent des données pour s’entraîner. Seul garde-fou : si l’auteur s’y est opposé expressément, cette collecte n’est pas possible, lorsqu’il s’agit d’un usage commercial.
Pour comprendre cette exception, il faut se remettre dans le contexte de 2019, date de conception de la directive, estime Arnaud Latil, maître de conférences de droit privé à Sorbonne Université et membre du Sorbonne Center for Artificial Intelligence (SCAI). À l’époque, ChatGPT, Midjourney et tous les autres ne sont pas encore lancés. « Les enjeux d’entraînement d’IA n’étaient pas sur le devant de la scène », explique-t-il. Les législateurs n’ont donc pas eu forcément conscience des conséquences de cette exception.
Problème supplémentaire : la façon dont l’auteur s’oppose à cette collecte n’est pas non plus précisée dans le texte. D’autant qu’en pratique, l’IA ne va ni demander, ni prévenir lorsqu’elle collecte une œuvre d’art ou un titre de musique pour s’entraîner. Elle ne va pas non plus faire la différence entre une œuvre tombée dans le domaine public, ou une œuvre protégée par le droit d’auteur, puisqu’elle scrappe de manière massive, sans distinction. D’ailleurs, la protection par le droit d’auteur n’est pas forcément mentionnée sur un site Web. Or, ce n’est pas parce qu’il n’y a aucune inscription sur une image que celle-ci est tombée dans le domaine public et qu’elle est libre de droits.
Mais aujourd’hui, le contexte est bien différent. Les artistes et les ayants droit sont vent debout contre les IA génératives et leur entraînement qui repose sur leurs œuvres. « La question, même si juridiquement, elle peut sembler réglée, politiquement, elle se pose de manière très importante aujourd’hui. Quid du droit des auteurs dont les œuvres ont été entraînées par des IA génératives ? », se demande Arnaud Latil.
La question se pose d’autant plus quand la « donnée scrappée » en question est la voix. Les comédiens de voix off ou de doublage, qui s’estiment en première ligne dans le « pillage de l’IA », n’hésitent pas à parler de « vol » de leur travail lorsque des IA génératives collectent leurs voix accessibles via des rediffusions, des podcasts ou des publicités diffusées en ligne. L’association Les Voix qui regroupe des artistes de voix de doublage a par exemple lancé plusieurs alertes et recommande aux artistes de multiplier les mentions sur les sites et dans leurs contrats, précisant qu’ils refusent que leurs voix soient utilisées à des fins d’entraînement par l’IA.
Génération de contenus : pour l’instant, c’est le vide (juridique)
Autre sujet épineux, la question des contenus générés par l’IA qui imiteraient à la perfection un style, un genre, ou la voix d’un artiste, ce qui revient à créer de nouvelles œuvres « à la manière » d’un artiste. Le mois dernier, une chanson générée par un système d’IA clonant les styles de Drake et de The Weeknd a rencontré un succès fou avant d’être retirée des plateformes de streaming de musique à la demande d’Universal Music Group.
« Aux États-Unis, des comédiens se sont aussi aperçus, en écoutant des programmes auxquels ils n’avaient jamais participé, qu’il s’agissait de leurs voix, de leurs timbres » dont l’IA s’était inspirée, après avoir été collectées sans autorisation pour s’entraîner. « Il y a des procès en cours, des demandes de retrait. En France, le problème n’est pas encore arrivé, car nous avons tiré la sonnette d’alarme », explique Patrick Kuban, comédien de voix off et co-fondateur de l’association Les Voix.
Ce dernier demande aux politiques de se saisir du problème et de s’accorder sur « un moratoire pour arrêter le pillage généralisé », en plus d’une traçabilité de ce qui a été généré par l’IA – qui indiquerait quels artistes ont donné leurs consentements pour que l’IA utilise leur voix, avec un numéro de licence, une certification RGPD…
Car jusqu’à présent, ce point précis des contenus générés par l’IA n’est tranché par aucun texte. « Là, on n’a aucune réponse. Ce n’est prévu nulle part », confirme Arnaud Latil. Car le droit protège seulement une œuvre en particulier et pas son style – par exemple, la copie d’un tableau de Chagall sera considérée comme contrefaisante, c’est-à-dire violant le droit d’auteur du peintre. Mais un tableau fait à la manière de Chagall ne le sera pas. En droit, on dit souvent que les idées, les styles ou les genres sont de libre parcours. Traduction : on ne protège pas ces éléments par le droit d’auteur. Seul le résultat de la création sera protégé.
Le sujet est devenu si sensible que les Parlementaires européens, lors de leur examen du Règlement sur l’IA, ont ajouté une disposition précisant que l’IA générative devait respecter le droit d’auteur, sans aucune autre indication. Pour le professeur, il faut, dans tous les cas, « adapter le droit d’auteur à l’IA, soit en prévoyant un nouveau texte régissant le droit d’auteur pour l’application à l’IA, soit en réformant le droit existant. Mais, ajoute-t-il, le débat doit s’ouvrir sur le droit d’auteur et l’IA ».