L’outil de détection de l’IA de Google est désormais disponible pour tous
Google a annoncé mercredi via une publication sur X (anciennement Twitter) que SynthID est désormais disponible pour tous ceux qui souhaitent l'essayer. Le système d'authentification pour le contenu généré par l'IA intègre des filigranes imperceptibles dans les images, vidéos et textes générés, permettant aux utilisateurs de vérifier si un élément de contenu a été créé par des humains ou des machines.
«Nous mettons en open source notre outil de filigrane SynthID Text», a écrit la société. "Disponible gratuitement pour les développeurs et les entreprises, il les aidera à identifier leur contenu généré par l'IA."
SynthID a fait ses débuts en 2023 comme moyen de filigraner les images, l'audio et la vidéo générés par l'IA. Il a été initialement intégré à Imagen, et la société a ensuite annoncé son intégration dans le chatbot Gemini en mai dernier lors de l'I/O 2024.
Le système fonctionne en codant des jetons – ce sont les éléments de données fondamentaux (qu'il s'agisse d'un seul caractère, d'un mot ou d'une partie d'une phrase) qu'une IA générative utilise pour comprendre l'invite et prédire le mot suivant dans sa réponse – avec des filigranes imperceptibles. pendant le processus de génération de texte. Il le fait, selon un blog DeepMind de mai , en « introduisant des informations supplémentaires dans la distribution des jetons au point de génération en modulant la probabilité de génération des jetons ».
En comparant les choix de mots du modèle ainsi que ses « scores de probabilité ajustés » avec le modèle de scores attendu pour le texte filigrané et non filigrané, SynthID peut détecter si une IA a écrit cette phrase.
Voici comment SynthID filigrane le contenu généré par l'IA selon les modalités. ↓ pic.twitter.com/CVxgP3bnt2
— Google DeepMind (@GoogleDeepMind) 23 octobre 2024
Ce processus n'a pas d'impact sur la précision, la qualité ou la rapidité de la réponse, selon une étude publiée mercredi dans Nature , et il ne peut pas non plus être facilement contourné. Contrairement aux métadonnées standard, qui peuvent être facilement supprimées et effacées, le filigrane de SynthID resterait même si le contenu a été recadré, édité ou autrement modifié.
"Réaliser un filigrane fiable et imperceptible du texte généré par l'IA est fondamentalement un défi, en particulier dans les scénarios où les résultats du [grand modèle de langage] sont presque déterministes, comme les questions factuelles ou les tâches de génération de code", Soheil Feizi, professeur agrégé à l'Université du Maryland. , a déclaré au MIT Technology Review , notant que sa nature open source « permet à la communauté de tester ces détecteurs et d'évaluer leur robustesse dans différents contextes, aidant ainsi à mieux comprendre les limites de ces techniques ».
Le système n’est cependant pas infaillible. Bien qu'il soit résistant à la falsification, les filigranes de SynthID peuvent être supprimés si le texte est exécuté via une application de traduction ou s'il a été fortement réécrit. Il est également moins efficace avec de courts passages de texte et pour déterminer si une réponse basée sur une déclaration factuelle a été générée par l’IA. Par exemple, il n'y a qu'une seule bonne réponse à la question « quelle est la capitale de la France ? » et les humains et l'IA vous diront que c'est Paris.
Si vous souhaitez essayer SynthID vous-même, il peut être téléchargé depuis Hugging Face dans le cadre de la boîte à outils Responsible GenAI mise à jour de Google.