Rejetez la « prostitution blanche » ! Des milliers d’écrivains s’expriment : l’IA générative doit également payer des droits d’auteur

L'IA générative basée sur le modèle du grand langage est toujours "indignée" après tout !

Plus de 8 500 auteurs de fiction, de non-fiction et de poésie ont récemment signé une lettre ouverte aux leaders de l'IA générative appelant les PDG d'OpenAI, Alphabet, Meta, Stability AI, IBM et Microsoft à demander le consentement, à reconnaître et à rémunérer équitablement les auteurs qui utilisent du matériel protégé par le droit d'auteur lors de la formation à l'IA.

"Les techniques d'IA génératives basées sur de grands modèles de langage doivent leur existence à notre travail", indique la lettre. "Ces techniques imitent et introspectent notre langage, nos histoires, nos styles et nos idées."

Cette affirmation est peut-être biaisée, mais lorsque nous examinons le fonctionnement de la technologie d'IA générative, elle n'est pas déraisonnable.

Plus précisément, l'IA générative fonctionne en utilisant des modèles d'apprentissage automatique pour apprendre des modèles et des relations dans des ensembles de données de contenu créés par l'homme, puis en utilisant les modèles appris pour générer un nouveau contenu. Parmi elles, les données pré-entraînées servent de carburant "pétrole".

Prenant l'exemple du ChatGPT actuellement populaire, les données publiques montrent que le volume de données de formation de ChatGPT est un corpus linguistique de 800 milliards de mots, dont 175 milliards de paramètres, et que le volume de données de pré-formation atteint 45 To.

Fait intéressant, la source d'un si grand ensemble de données de ChatGPT a toujours été "couverte de brouillard".

Les responsables d'OpenAI ont déclaré qu'au vu de la situation concurrentielle et des implications en matière de sécurité des modèles à grande échelle tels que GPT-4, il ne divulgue plus d'informations sur la source de ses ensembles de données et a vaguement déclaré qu'ils proviennent principalement d'Internet, des médias sociaux, des actualités, des livres, etc.

Dans l'article présentant ChatGPT-3 en 2020, OpenAI, qui n'a pas encore explosé, admettait franchement que 15 % de son ensemble de données d'entraînement provenaient de « 2 corpus de livres sur Internet ». Bien qu'OpenAI n'ait pas explicitement révélé le fonctionnement de ces ensembles de données, de nombreux lanceurs d'alerte affirment que ces ensembles de données proviennent de la "bibliothèque fantôme" qui fournit des livres gratuits aux personnes d'une manière qui enfreint le droit d'auteur.

En février de cette année, OpenAI a été accusé par de nombreux médias d'utiliser leurs articles à des fins de formation sans autorisation. Lorsqu'un journaliste du Wall Street Journal a demandé à ChatGPT une liste des sources d'information sur lesquelles il avait été formé, la réponse qu'il a reçue énumérait 20 médias, dont le Journal, qui n'était pas autorisé. D'autres IA génératives qui "marchent toujours au bord de la rivière" peuvent-elles vraiment "ne pas se mouiller les pieds" ?

Donc, dans l'ensemble, il est difficile de ne pas rendre ces écrivains pleins de doutes quant à savoir si leurs droits d'auteur ont été endommagés.

Plus important encore, la lettre ouverte mentionne également qu'au cours de la dernière décennie, le revenu des écrivains a chuté de 40 % et que le revenu médian actuel des écrivains à temps plein n'est que de 23 000 dollars américains d'ici 2022. L'invasion de l'IA pourrait rendre la situation des écrivains plus difficile.

Par conséquent, les défenseurs ont également émis une demande dans la lettre, demandant aux dirigeants de l'IA générative de faire les trois choses suivantes.
– obtenir la permission d'utiliser notre matériel protégé par le droit d'auteur, etc. dans vos programmes d'IA générative ;
– rémunérer équitablement les auteurs passés et présents qui utilisent notre travail dans vos programmes d'IA générative ;
– indemniser équitablement les auteurs qui utilisent notre travail dans la sortie de l'IA, que la sortie enfreigne ou non la loi en vigueur ;

Désormais, la pression est sur les leaders de l'IA générative.

Vous devez savoir que de nombreux leaders de l'IA générative ont pris des engagements "verbaux" plus rigoureux en matière de protection du droit d'auteur en public. Lors de l'audience du Congrès américain en mai de cette année, Altman, le "chef" d'OpenAI, a souligné que les créateurs de contenu bénéficieront des outils d'IA et auront la propriété et le contrôle de leurs œuvres. Depuis lors, Altman est devenu un "missionnaire" et a parcouru des pays du monde entier pour encourager l'IA générative.

La "gifle" est venue trop vite, et maintenant les poursuites sans fin pour fuite de confidentialité et les incidents de violation du droit d'auteur ont complètement mis cette lettre d'appel sur la table, et elle est devenue un "talisman de la mort" inévitable.

Seulement cette fois, les leaders de l'IA générative ferment-ils les yeux ?

#Bienvenue pour suivre le compte public WeChat officiel d'Aifaner : Aifaner (WeChat ID : ifanr), un contenu plus excitant vous sera présenté dès que possible.

Ai Faner | Lien d'origine · Voir les commentaires · Sina Weibo