[OPINION] Création d’art par l’intelligence artificielle : Droit et Dall-e

[OPINION] Création d’art par l’intelligence artificielle : Droit et Dall-e

Les images qui chapeautent ce texte sont générées par Dall-e – un système d’intelligence artificielle qui se prétend capable d’imiter le style de Salvador Dalí. Susciteraient-elles l’ire du peintre espagnol s’il les voyait ? Tant d’efforts, pour peaufiner un style, seulement pour que n’importe quel quidam qui dispose d’une connexion internet puisse se l’approprier et le « bâtarder » à sa guise…

Le droit n’offre-t-il pas des remparts pour prévenir cela? Dans un article paru récemment dans La Presse, plusieurs artistes inquiets s’interrogent quant à cette question. Ils nous invitent à réfléchir aux enjeux de droit d’auteur qui découlent de la démocratisation de systèmes d’IA capables de générer des œuvres d’art qui, tout en étant originales, s’inspirent du style d’artistes établis.

Pour défricher la question, je me suis entretenue avec Tom Lebrun, un juriste qui se spécialise dans les questions d’art algorithmique afin qu’il m’aide à me faire une tête quant à l’état du droit en matière de création artistique par IA.

L’entrevue en format balado est disponible ici.

Après cet entretien inspirant, j’ai voulu approfondir quelques-unes des questions dont nous avions traité. Le texte qui suit s’intéresse aux solutions qu’offre le droit d’auteur aux artistes qui se sentent lésés par Dall-e. Quels sont leurs droits quant à la reproduction de leurs oeuvres dans la base de données de Dall-e ? Et quant à l’imitation de leur style par Dall-e? C’est ce dont nous allons traiter.

Le fonctionnement technique de Dall-e

Avant de creuser les questions de propriété intellectuelle, il importe de brosser un portrait réaliste de Dall-e : peut-il vraiment générer des œuvres d’art ? De quelle manière s’y prend-il ? Et quelles sont ses principales lacunes ? Passons un peu de temps sur ces questions, cela nous aidera à mieux comprendre les enjeux relatifs aux droits d’auteurs par la suite.

Commençons par mettre à l’épreuve les capacités artistiques de Dall-e. L’intelligence artificielle permet-elle vraiment, désormais, de générer de faux Dali? Pour faire le test, j’ai épluché le catalogue d’œuvres de Salvador Dali afin de trouver des tableaux aux titres inspirants. J’ai ensuite soumis ces titres à Dall-e pour qu’il produise ses propres œuvres.

On peut ici comparer le travail du peintre espagnol avec celui de son homonyme algorithmique :

Chair, Bed and Bedside Table Ferociously Attacking a Cello

Bed and Bedside Table Ferociously Attacking a Cello, Salvador Dali (1983)

Crâne et son appendice lyrique s’appuyant sur une table de nuit qui aurait la température d’un nid de cardinal

Les résultats sont somme toute impressionnants. Certes, Dall-e n’a pas saisi qu’un « appendice lyrique » était un piano, mais on l’en excusera. Aussi poétique soit-il, le terme « appendice lyrique » n’est pas particulièrement explicite. La relation entre les objets semble aussi poser problème à Dall-e : ni la table, ni le lit, ni la chaise n’attaquent le violoncelle – et le crâne, pour sa part, ne s’accote pas sur quoi que ce soit! Toujours est-il que les images sont belles et que, pour un néophyte du moins, elles présentent une parenté de style avec les œuvres du véritable Dali.

Comment un ordinateur arrive-t-il à produire de tels résultats?

Pour comprendre, intéressons-nous d’un peu plus près au fonctionnement de Dall-e. Il s’agit d’un système d’intelligence artificielle à la fine pointe de la technologie. Il est composé de plusieurs réseaux de neurones profonds qui, tour à tour, accomplissent une partie de la tâche requise pour générer l’image demandée.

Ces réseaux de neurones sont entraînés sur de gigantesques quantités de données. Dans le cas de Dall-e, ce sont 650 millions de paires images+légendes grappillées sur internet qui ont été utilisées. Ces données ont servi d’exemples pour les réseaux de neurones. À force d’analyser des millions d’images, les réseaux de neurones sont devenus très performants pour réaliser leur petit bout de tâche.

Sur la chaîne de montage algorithmico-artistique de Dall-e, la nature du travail est diverse. Un réseau de neurones encode les éléments importants d’une requête (le style, les couleurs, les objets, etc.) en langage informatique ; un autre reconstitue une image brouillée en lui ajoutant des détails qui la rendront plus claire et précise. Les réseaux de neurones se relaient pour arriver à générer une image originale qui correspond à la requête d’un internaute.

Or, aussi performants soient-ils, ces réseaux de neurones ont aussi des lacunes. Évidemment, il y a toutes les questions de propriété intellectuelle auxquelles nous reviendrons dans un instant. Mais avant de nous plonger dans cette question, il nous faut traiter de deux autres problèmes.

Dall-e est polluant et génère des représentations biaisées de la société.

Commençons par nous attaquer à la question environnementale. L’empreinte carbone de Dall-e est considérable. On s’en doute, entraîner des réseaux de neurones profonds sur 650 millions d’images requiert beaucoup d’ordinateurs et beaucoup de serveurs qui fonctionnent en continu pendant plusieurs jours. On ne peut malheureusement pas calculer l’empreinte exacte de Dall-e car l’information nécessaire pour le faire est gardée secrète. Or, des études menées sur des systèmes moins complexes, entraînés sur de plus petites quantités de données, laissent planer peu de doutes : les systèmes d’apprentissage profond ont un coût environnemental important. Il est bon de se le rappeler, lorsque l’on génère pour une énième fois, une peinture d’une table de chevet qui attaque férocement un violoncelle…

Passons à la question des biais et de la représentativité, maintenant.

Il est important de mentionner que l’équipe derrière Dall-e déploie beaucoup d’efforts pour mitiger ce problème. Or Dall-e demeure un système probabiliste qui prédit ce à quoi une image devrait ressembler en s’appuyant sur ce qu’il a vu dans le jeu de données sur lequel il a été entraîné. Puisqu’il a été entraîné sur des millions d’images siphonnées sur le web, Dall-e reproduit (et accentue) les biais des sociétés occidentales.

C’est donc dire que Dall-e n’aura pas tendance à générer l’image d’une femme informaticienne, car sur la majorité des images que l’on a utilisées pour l’entraîner, les informaticiens étaient des hommes – et si cela est vrai en matière de genre, le problème est encore plus marqué lorsque l’on s’intéresse à la diversité raciale.

Autant le problème environnemental de Dall-e, que les enjeux de biais qu’il soulève sont cruciaux et méritent que l’on s’y intéresse avec attention. Or, ce n’est pas ce sur quoi porte le présent article – ce sera pour un prochain texte.

Pour l’instant, revenons-en à la promesse formulée en début de texte, intéressons-nous aux enjeux de propriétés intellectuelles soulevés par Dall-e.

Les enjeux juridiques relatifs à la reproduction des œuvres dans la base de données

On l’a dit plus tôt, si Dall-e arrive à générer des images, c’est qu’il a vu des centaines de millions d’exemples sur lesquels il a appris. Dall-e est capable de générer des œuvres à la Dali, c’est qu’il a vu beaucoup, beaucoup d’œuvres de Salvador Dali.

Reproduire ainsi des œuvres dans une base de données pour entraîner un système d’intelligence artificielle constitue-t-il une forme d’exploitation du travail des artistes? Les artistes consentent-ils à cette utilisation de leur œuvre? Reçoivent-ils une quelconque forme de rémunération?

Pour l’instant, non ; ce qui suscite la colère de certains d’entre eux.

Un photographe interrogé par La Presse partage sa frustration: « Je travaille de nombreuses heures sur chacune des photos que je produis. De voir mes œuvres se retrouver sur ce genre de site sans mon consentement devient très frustrant. »

Pour répondre à ces préoccupations, intéressons-nous donc à la question suivante : les artistes dont les œuvres se trouvent dans la base de données de Dall-e disposent-ils de recours pour violation de leur droit d’auteur ?

En tout premier lieu, il faut se rappeler d’une chose : pour faire valoir son droit à ne pas être copié dans la base de données , un artiste doit être certain que ses œuvres ont été utilisées pour entraîner Dall-e. Et il doit être en mesure d’en faire la preuve. Cette étape semble en apparence simple, or elle peut s’avérer plus complexe que ce qu’elle laisse présager de prime abord.

Prenons le cas d’Alfred Pellan, par exemple.

¬Il est difficile d’affirmer avec certitude que les œuvres de l’artiste se retrouvent dans la base de données qui a servi à entraîner Dall-e. Lorsqu’on essaie de générer des œuvres dans le style du peintre québécois, on constate que Dall-e semble avoir une vague idée de ce à quoi le style de Pellan devrait ressembler: couleurs saisissantes, compositions éclatées, etc… mais les résultats ne sont pas spectaculairement ressemblants.

Delirium Concerto

Aux petites têtes, du livre d’artiste «Délirium Concerto», Alfred Pellan (1982)

Il est loin donc d’être certain que les ayants droits de Pellan arriveraient à démontrer que la balance des probabilités penche en leur faveur – c’est-à-dire à faire la démonstration que les probabilités que les œuvres de Pellan aient été utilisées pour entraîner Dall-e sont plus grandes que les probabilités que ces images ne se retrouvent pas dans la base de données.

Et il ne s’agit que du premier obstacle auquel un artiste pourrait se heurter. En effet, l’équipe de développeurs derrière Dall-e dispose de deux autres arguments assez convaincants pour se défendre, s’ils étaient accusés d’utiliser des œuvres protégées sans obtenir le consentement des artistes ni leur verser des droits d’auteurs.

Le premier argument est celui de l’utilisation équitable.

L’utilisation équitable est une exception aux principes généraux du droit d’auteur qui est codifiée aux articles 29 et suivants de la Loi sur le droit d’auteur. Cette exception prévoit que l’utilisation équitable d’une œuvre à des fins de recherche ne constitue pas une violation du droit d’auteur.

Soyons clairs. Cette exception ne s’applique pas toujours. Ce n’est pas un laissez-passer gratuit permettant de violer la propriété intellectuelle de tout un chacun pour autant que l’on poursuive des fins de recherches. Il y a des critères à respecter. Pour être considérée comme équitable, l’utilisation d’une œuvre doit se justifier en regard d’un test en six étapes développé par la Cour suprême dans l’arrêt CCH :

  • Quel est le but de l’utilisation de l’oeuvre protégée
  • Quelle est à la nature de l’utilisation de l’oeuvre protégée
  • Quelle est l’ampleur de l’utilisation de l’œuvre protégé
  • Quelles sont les solutions de rechange à l’utilisation de l’oeuvre protégée
  • Quelle est la nature de l’œuvre protégée
  • Quels sont les effets de l’utilisation de l’oeuvre protégée

Comme Dall-e se trouve à la frontière de la recherche et des fins commerciales, difficile de prédire de quel côté la balance pencherait. Selon la Cour suprême, certaines utilisations « peuvent être plus ou moins équitables que d’autres ; la recherche effectuée à des fins commerciales peut ne pas être aussi équitable que celle effectuée à des fins de bienfaisance. »

Est-ce donc dire que la recherche à des fins commerciales n’est pas équitable? Ou qu’elle l’est simplement moins? Plusieurs juristes reconnus, Carys J Craig, Teresa Scassa et Michael Geist notamment, déplorent l’incertitude qui plane quant à cette question en matière d’intelligence artificielle.

Le deuxième argument est celui du contenu non-expressif.

Selon cet argument, reproduire les œuvres d’un artiste pour entraîner des modèles d’intelligence artificielle n’est pas une pratique qui tombe sous le coup du droit d’auteur.

Le raisonnement qui sous-tend cet argument se décline ainsi : la reproduction d’œuvres d’art pour entraîner des systèmes d’apprentissages automatiques porte sur les composantes non expressives des œuvres – des données factuelles comme l’occurrence de certains mots ou de certaines couleurs, par exemple. Cela ne devrait pas être couvert par le droit d’auteur qui protège plutôt l’expression qui peut être appréciée par un être humain.

Cet argument est emprunté au droit américain. Il n’est pas vraiment en phase avec la jurisprudence canadienne, et la doctrine est partagée quant à son applicabilité en droit canadien. Dans le Canada anglais, certains auteurs soutiennent que l’argument devrait trouvé application ici aussi.

Pour Tom Lebrun cependant, “l’argument manque quelque peu de mordant. En effet, les machines approprient l’oeuvre dans son ensemble – elles ne traitent pas simplement les composantes non expressives. Si l’on fait le parallèle avec la jurisprudence canadienne qui veut que l’on évalue la violation du droit d’auteur à partir de ce qui constitue une “partie importante” de l’oeuvre originale (la notion de partie importante étant purement jurisprudentielle), alors force est de constater que l’appropriation de toute l’oeuvre, même par une machine, remplit de facto ce critère.”

Il n’est donc pas du tout certain qu’Open AI pourrait invoquer avec succès cette exception du contenu non expressif au Canada. Reste que l’argument n’est pas complètement farfelu ou sans valeur.

Alors, si on récapitule.

Un artiste qui voudrait faire valoir que son droit d’auteur a été violé par l’inclusion de ses oeuvres dans la base de données de Dall-e devrait être en mesure de démontrer que les probabilités que son oeuvre se retrouve dans la base de données de Dall-e sont plus grandes que les probabilités qu’elles ne s’y retrouvent pas. Puis, il devrait s’engager dans un débat juridique à savoir s’il est nécessaire d’obtenir un consentement pour utiliser des œuvres protégées pour entraîner des systèmes d’intelligence artificielle. Comme il s’agit de questions juridiques complexes, il est difficile de prédire qu’elle serait l’issue du litige.

Une chose est certaine, toutefois.

L’artiste qui voudrait se lancer dans ce combat devra avoir les reins solides pour payer les frais découlant d’un tel litige – ou à tout le moins avoir à ses côtés un bataillon d’avocats pro bono.

Les enjeux juridiques relatifs à la reproduction du style d’un artiste

Ce qui semble irriter particulièrement les artistes, cependant, ce n’est pas tant l’inclusion de leurs œuvres dans la base de données à proprement parler. C’est surtout l’imitation de styles, qui semble agacer.

Dans l’article de La Presse toujours, un peintre s’inquiète que les oeuvres générées par intelligence artificielle ne soient pas à la hauteur du travail original des artistes : « La grande majorité des toiles que je crée, je les jette parce que je juge qu’elles ne sont pas à la hauteur, parce qu’elles n’ont pas d’âme. […] Avec cette machine, il n’y a pas mon jugement final. »

Un artiste aurait-il des recours pour s’opposer à l’imitation de son style par Dall-e… pour protéger la pureté et la qualité de son œuvre?

Tout dépend de la nature de l’imitation.

Reproduire une partie importante d’une œuvre originale sans le consentement de l’auteur constitue une violation du droit d’auteur de celui-ci. Les reproductions à l’identique, évidemment, constituent des violations du droit d’auteur, mais le principe s’étend également au-delà des reproductions littérales. Le droit d’auteur d’un dramaturge, par exemple, pourrait être violé par une œuvre qui ne reprend absolument aucune réplique de la pièce originale.

Parlez-en à Claude Robinson…

En effet, l’affaire Cinar Corporation c. Robinson est un excellent exemple de reproduction qui, sans être identique, porte atteinte au droit d’auteur de quelqu’un. Dans cette affaire, la compagnie de production Cinar s’était très lourdement inspirée d’un projet d’émission jeunesse imaginé par Robinson afin de créer elle-même une nouvelle émission du même genre. Les personnages étaient différents, mais les similitudes étaient suffisantes pour qu’à l’issue d’une longue saga judiciaire, la Cour suprême ordonne qu’une somme de près de 4 millions de dollars soit versée à Robinson pour violation de ses droits d’auteur.

Qu’en serait-il pour une œuvre générée par Dall-e?

Pour déterminer si la reproduction d’un style par Dall-e constitue une atteinte au droit d’auteur d’un artiste, il faut d’abord déterminer si le style de l’artiste possède les caractéristiques d’une oeuvre originale, c’est-à-dire qu’on y reconnait «l’exercice du talent et du jugement» de l’artiste.

Ensuite, tout est une « question de nuance, de degré et de contexte». Il faudra analyser la nouvelle œuvre et déterminer si elle s’approprie « les traits distincts de l’œuvre originale». Parallèlement, il faudra se demander si les différences entre l’œuvre originale et l’œuvre générée par Dall-e sont suffisamment importantes que « que l’œuvre, prise dans son ensemble, constitue non pas une imitation, mais plutôt une œuvre nouvelle et originale ».

De toutes les œuvres présentées jusqu’à maintenant, seuls les « faux Dali » où un violoncelle se fait attaquer par du mobilier de chambre à coucher nous semble être suffisamment ressemblants pour être qualifiés de reproductions au sens du droit actuel.

On pourrait imaginer qu’un portrait de style pop art du roi Charles III inspiré des portraits qu’Andy Warhol a fait de la reine Elizabeth II constituerait aussi un autre exemple d’œuvre s’appropriant les traits distinctifs d’une œuvre originale d’une manière qui serait protégée par le droit d’auteur. En revanche, le portrait d’une sans-abri qui imiterait le style de ces mêmes portraits ne remplirait probablement pas les critères.

QUEEN ELIZABETH II OF THE UNITED KINGDOM (F. & S. II.334 – 337)

Queen Elizabeth II, from Reigning Queens | Menzies Art ...

(c) Andy Warhol/Copyright Agency, 2021

Dans le cas du portrait d’une sans-abri à la manière d’Andy Warhol, les ayants droit de ce dernier se verraient opposer deux arguments pour réfuter les accusations de reproduction.

D’abord, on tenterait de soutenir que les différences entre les deux œuvres sont suffisantes pour considérer que le portrait d’une sans-abri est une nouvelle œuvre originale et non pas une reproduction. Et puis, dans un deuxième temps, on soutiendrait que l’utilisation du style de Warhol relève de l’utilisation équitable – cette même utilisation équitable dont nous avons parlé au titre précédent – qui couvre aussi la critique, la parodie et la satire. Pour faire valoir cet argument, il faudrait passer à travers le test de l’arrêt CCH présenté précédemment, mais cette fois en argumentant que l’objectif poursuivi par l’utilisation de l’œuvre est soit la critique, la parodie ou la satire, plutôt que les fins de recherches.

Encore une fois, il n’est pas certain du résultat auquel un tribunal arriverait. Il n’est pas évident qu’un artiste pourrait avoir gain de cause dans le cadre d’un recours pour reproduction de son style. En effet, bien que le droit canadien offre plus de chances de succès que le droit américain, il n’offre certainement pas aux artistes une protection à toute épreuve.

Cela dit, si cela peut rassurer les artistes, rares sont les œuvres produites par Dall-e qui atteignent un niveau de raffinement suffisant pour faire concurrence à de véritables artistes.

Pour s’en convaincre, concluons avec une démonstration.

Lesquelles de ces oeuvres sont générées par Dall-e, et lesquelles sont des oeuvres originales de Fernando Botero, Jean Paul Riopelle et Robert Mapplethorpe ?

Sur le même thème :

Crédit Image à la Une : Dall-e