Voici comment ChatGPT pourrait résoudre son problème majeur de plagiat

26 janvier 2023 Hibou Gourou

ChatGPT est un outil merveilleux, mais il y a un côté sombre à ce service d'IA avancé qui peut écrire comme un expert sur presque tous les sujets : le plagiat. Lorsque des étudiants censés démontrer leurs connaissances et leur compréhension d'un sujet trichent en utilisant secrètement ChatGPT, cela invalide les tests et la notation. Les compétences en IA sont excellentes, mais ne sont pas la seule matière que les élèves devraient apprendre.

Le contrôle de ce problème s'est avéré difficile. Étant donné que ChatGPT a été formé sur un vaste ensemble de données d'écriture humaine, il est presque impossible pour un instructeur d'identifier si un essai a été créé par un étudiant ou une machine. Plusieurs outils ont été créés pour tenter de reconnaître l'écriture générée par l'IA , mais la précision était trop faible pour être utile.

Au milieu des inquiétudes croissantes des éducateurs et des interdictions imposées aux étudiants d'utiliser ChatGPT, Business Insider rapporte qu'OpenAI travaille sur une solution à ce problème. Un tweet récent de Tom Goldstein, professeur agrégé d'apprentissage automatique à l'Université du Maryland, a expliqué à quel point il pourrait être précis pour détecter le texte en filigrane écrit par ChatGPT.

#OpenAI prévoit d'empêcher les utilisateurs de #ChatGPT de créer des robots de réseaux sociaux et de tricher sur leurs devoirs en "filigrane" les sorties. Dans quelle mesure cela pourrait-il vraiment fonctionner ? Voici seulement 23 mots d'un paramètre 1.3B filigrané LLM. Nous l'avons détecté avec une confiance de 99,999999999994 %. Voici comment pic.twitter.com/pVC9M3qPyQ
— Tom Goldstein (@tomgoldsteincs) 25 janvier 2023

Tout outil capable d'identifier le plagiat avec une précision de près de 100 % réglerait cette discussion rapidement et atténuerait toute inquiétude. Selon Goldstein, une solution consiste à faire en sorte que le grand modèle de langage (LLM) choisisse parmi un vocabulaire limité de mots, formant une liste blanche que l'IA peut utiliser et une liste noire de mots interdits. Si un nombre anormalement élevé de mots de la liste blanche apparaît dans un échantillon, cela suggérerait qu'il a été généré par l'IA.

Cette approche simpliste serait trop restrictive car il est difficile de prédire quels mots pourraient être nécessaires pour une discussion lorsque l'on travaille un mot à la fois, comme le font la plupart des LLM. Goldstein suggère que ChatGPT pourrait avoir la possibilité d'anticiper plus d'un mot afin qu'il puisse planifier une phrase qui peut être remplie de mots sur la liste blanche tout en ayant un sens.

ChatGPT a fait sensation lorsqu'il est entré dans le pool d'écriture de la communauté et peut également être un excellent outil pédagogique. Il est important d'introduire l'intelligence artificielle dans les écoles car ce sera clairement une technologie importante à comprendre à l'avenir, mais elle continuera d'être controversée jusqu'à ce que la question du plagiat soit résolue.