Meta fait face à un procès pour avoir entraîné l’IA avec des livres piratés

Dans un récent procès, Meta a été accusée d'utiliser des livres piratés pour entraîner ses modèles d'IA, avec l'approbation du PDG Mark Zuckerberg. Selon Ars Technica , le procès intenté par des auteurs, dont Ta-Nehisi Coates et Sarah Silverman, devant un tribunal fédéral de Californie, cite des communications internes de Meta indiquant que la société a utilisé l'ensemble de données Library Genesis (LibGen), un vaste référentiel en ligne connu pour héberger des livres piratés, malgré des inquiétudes internes quant à la légalité de l'utilisation de ce matériel.

Les auteurs affirment que les actions de Meta portent atteinte à leurs droits d'auteur et pourraient nuire à la position de l'entreprise auprès des régulateurs. Ils affirment que les modèles d'IA de Meta, y compris Llama, ont été formés en utilisant leurs œuvres sans autorisation, ce qui pourrait nuire à leurs moyens de subsistance. Meta a défendu ses pratiques en invoquant la doctrine du « fair use », affirmant que l’utilisation de matériaux accessibles au public pour former des outils d’IA est légale dans certains cas, comme « l’utilisation de texte pour modéliser statistiquement le langage et générer une expression originale ».

Un message interne mis en évidence dans le procès cite un employé exprimant son malaise, déclarant : « Torrenter à partir d'un ordinateur portable d'entreprise ne semble pas correct. »

En réponse au procès, le juge de district américain Vince Chhabria a rejeté certaines plaintes, mais a autorisé les auteurs à modifier leur plainte pour inclure de nouvelles allégations, notamment celles liées à la suppression d'informations sur la gestion des droits d'auteur. Cette affaire fait partie d'une vague plus large de contestations judiciaires contre des entreprises technologiques comme Meta, OpenAI et Anthropic, où les auteurs et les créateurs cherchent à protéger leurs droits de propriété intellectuelle face à l'évolution rapide des technologies d'IA.

L’issue de ce procès pourrait avoir des implications importantes pour l’industrie technologique, notamment en ce qui concerne l’utilisation de matériels protégés par le droit d’auteur dans la formation en IA. Cela soulève d'importantes questions sur l'équilibre entre l'innovation technologique et la protection des droits des créateurs.