GPTZero : comment utiliser l’outil de détection ChatGPT

8 mars 2024 Hibou Gourou

En termes de technologies qui changent le monde, ChatGPT a véritablement eu un impact considérable sur la façon dont les gens envisagent l'écriture et le codage dans le peu de temps où il est disponible. Être capable de brancher une invite et d'obtenir un flux de texte presque suffisant est une proposition tentante pour de nombreuses personnes qui n'ont pas confiance en leurs compétences en rédaction ou qui cherchent à gagner du temps. Cependant, cette capacité présente un inconvénient important, en particulier dans l'éducation, où les étudiants sont tentés d'utiliser ChatGPT pour leurs propres devoirs ou examens . Cela les empêche d’apprendre autant qu’ils le pourraient, ce qui donne aux enseignants un tout nouveau casse-tête lorsqu’il s’agit de détecter l’utilisation de l’IA.

Les enseignants et autres utilisateurs recherchent désormais des moyens de détecter l'utilisation de ChatGPT dans le travail des étudiants, et beaucoup se tournent vers des outils comme GPTZero, un outil de détection ChatGPT conçu par Edward Tian, étudiant à l'Université de Princeton. Le logiciel est accessible à tous, donc si vous souhaitez l'essayer et voir les chances qu'un morceau de texte particulier ait été écrit à l'aide de ChatGPT, voici comment procéder.

Qu’est-ce que GPTZero ?

Un rendu MidJourney d'un étudiant et de son ami robot devant un tableau noir. — Image utilisée avec la permission du détenteur des droits d'auteur

GPTZero est une application Web et un service conçus pour détecter si un corps de texte a été écrit par un humain ou par une intelligence artificielle . Tian, un étudiant de 22 ans étudiant en informatique à l'Université de Princeton et ancien stagiaire en génie logiciel chez Microsoft, est le développeur de GPTZero.

GPTZero a été annoncé pour la première fois via le tweet de Tian le 2 janvier 2023, en tant qu'outil permettant de détecter le plagiat de l'IA. Tian a noté que l'analyse était basée sur les recherches du doctorat de Princeton. candidat Sreejan Kumar et le travail du Natural Language Processing Group de Princeton.

l'analyse est basée sur des recherches en cours avec et @sreejan_kumar et @princeton_nlp . j'espère que nous publierons bientôt quelque chose d'empirique. mais en attendant, c'était une application amusante à créer
— Edward Tian (@edward_the6) 3 janvier 2023

GPTZero est-il gratuit ?

GPTZero a été conçu pour les éducateurs, mais tout le monde peut l'utiliser gratuitement. Il est peu probable que ce soit toujours le cas. Les conditions de service mentionnent que certains services peuvent être payants . Il est également fait mention d'un essai gratuit de 30 jours pour les nouveaux utilisateurs qui s'inscrivent.

Les conditions de service de GPTZero mentionnent des frais. — Image utilisée avec la permission du détenteur des droits d'auteur

GPTZero n'est pas un projet open source, et Tian serait confronté à des frais d'hébergement élevés sans l'aide de Streamlit, un framework d'application Python avec un service cloud gratuit pour les applications Streamlit. Alors que le trafic de GPTZero ne représente qu'une infime fraction de ce dont bénéficie ChatGPT, même OpenAI a décidé de commencer à facturer pour compenser ses coûts.

Bien que l'hébergement Streamlit soit gratuit, cela limite généralement la bande passante et les ressources sur cette plateforme partagée. Cela aurait restreint l'utilisation d'une application populaire comme GPTZero.

Streamlit aide actuellement Tian en augmentant la mémoire de l'application et l'allocation d'hébergement de GPTZero. Si la croissance continue à un rythme rapide, cela pourrait changer.

merci @DataChaz et le reste de l'équipe @streamlit pour avoir généreusement augmenté l'hébergement et la mémoire de gptzero :))
— Edward Tian (@edward_the6) 4 janvier 2023

GPTZero est-il précis ?

Certains prétendent que GPTZero peut être trompé. Suite à une suggestion de l'utilisateur de Reddit Smellz_Of_Elderberry , j'ai demandé à ChatGPT d'écrire une brève histoire sur le livre Le vieil homme et la mer comme s'il s'agissait d'un lycéen. GPTZero n'a pas été dupe.

ChatGPT écrit comme si c'était un lycéen — Image utilisée avec la permission du détenteur des droits d'auteur

J'ai réessayé, en modifiant le texte avec des signes de ponctuation mal placés, un temps de verbe incorrect et d'autres petites erreurs, mais GPTZero a quand même déclaré : « votre texte est susceptible d'être entièrement écrit par l'IA ».

Le mot clé ici est « probable » et le développeur n’a jamais promis que GPTZero était parfait. La précision de GPTZero est encore en cours d’évaluation, mais de manière anecdotique, il semble bien fonctionner pour la plupart des gens.

Si vous utilisez GPTZero, il est important de garder à l'esprit que des erreurs sont possibles. Lorsque vous utilisez GPTZero pour détecter l'IA ou ChatGPT pour aider à rédiger un document, vous devez toujours vérifier le travail pour les erreurs .

Comment fonctionne GPTZero ?

L'évaluation de texte AI de GTPZero comprend des statistiques de perplexité et de rafale. — Image utilisée avec la permission du détenteur des droits d'auteur

GPTZero analyse le caractère aléatoire du texte, appelé perplexité, et l'uniformité de ce caractère aléatoire au sein du texte, appelé rafale en statistiques. Une IA est très cohérente dans sa perplexité et sa turbulence, tandis que les écrivains humains varient ces caractéristiques sans aucune conscience.

Le travail n'est pas terminé et Tian note que davantage de tests seront ajoutés pour améliorer la précision de la détection de texte par l'IA. En particulier, les biais implicites sont un domaine exploré comme autre moyen de détecter si le texte est généré par une IA.

nous étudions toujours les biais implicites dans le texte généré par LM en ce moment, nous espérons donc ajouter quelques tests et facteurs supplémentaires pour améliorer le modèle
— Edward Tian (@edward_the6) 3 janvier 2023

Comment puis-je utiliser GPTZero ?

GPTZero est disponible sur son site Internet ou via une interface de programmation d'application (API). Pour utiliser le site Web, copiez simplement le texte que vous souhaitez vérifier et collez-le dans la grande case intitulée Essayez-le .

Le site Web de GPTZero est assez simple avec une zone de texte et un bouton de soumission. — Image utilisée avec la permission du détenteur des droits d'auteur

Il est également possible de télécharger un document PDF, Word ou un fichier texte et de cliquer sur le bouton Obtenir les résultats . Vous devrez également cocher la case signifiant que vous acceptez les conditions d'utilisation.

Pourquoi mes écrits sont-ils signalés comme IA ?

Parallèlement à l'essor de ChatGPT et à l'essor des outils de détection de l'IA, les écrivains et les lecteurs se demandent désormais comment savoir si le contenu est créé par l'IA et si une véritable écriture est étiquetée comme provenant d'une IA. C’est particulièrement un problème pour les étudiants, qui pourraient subir des conséquences de la part de leurs écoles ou universités s’il s’avère qu’ils utilisent l’IA. Certains étudiants ont désormais l'habitude d'exécuter leur propre travail original à l'aide de détecteurs tels que GPTZero et constatent qu'il signale les phrases écrites par l'IA, même si ce n'est pas le cas.

En 2024, un écrivain pour The Atlantic, Ian Bogost, a décrit avoir exécuté son propre travail original via un logiciel de détection de plagiat et avoir découvert qu'au départ, 74 % de son travail était signalé comme plagié. Avec une vérification et une élimination minutieuses, il a réussi à ramener ce nombre à zéro, mais il lui a fallu plusieurs heures de révision et d'ajustements des paramètres pour y arriver.

La détection par l'IA est similaire à la détection du plagiat, dans la mesure où les deux ne peuvent refléter que les meilleures suppositions quant à savoir si un écrit est original et généré par l'homme ou non. Et ces outils nécessitent un examen minutieux, car tous deux peuvent avoir tendance à produire des faux positifs . Si vous constatez que votre travail est signalé comme généré par l'IA sur GPTZero alors que ce n'est pas le cas, cela peut être dû à des raisons aussi générales que ne pas être de langue maternelle anglaise, être trop répétitif dans vos idées ou avoir utilisé un un outil comme Grammarly.

Si votre travail est signalé comme IA, vérifiez que toutes vos citations et citations sont correctement formatées et essayez d'éviter d'utiliser des outils automatiques comme Grammarly pour apporter des modifications.

Avons-nous vraiment besoin de contrôles de plagiat ?

Allant bien au-delà du laboratoire de recherche auquel de nombreuses IA de génération de texte sont liées, OpenAI a rendu ChatGPT public fin novembre 2022 . En janvier 2023, ChatGPT comptait plus de 100 millions d'utilisateurs, ce qui en fait l'application publique à la croissance la plus rapide à ce jour.

Cela signifie que les inquiétudes concernant le plagiat ne feront qu’augmenter à mesure que cette assistance de l’IA deviendra disponible dans tous les domaines de la vie. Microsoft intègre la technologie OpenAI dans la recherche Bing et Google teste sa propre version, connue sous le nom de Gemini (anciennement Bard) .

Une peinture couleur d'un robot riant, générée par Dall-E. — Image utilisée avec la permission du détenteur des droits d'auteur

Dans le même ordre d’idées, les générateurs d’images IA comme Dall-E et Stable Diffusion sont sous surveillance pour violations potentielles du droit d’auteur. Tous ces services d’intelligence artificielle ont été formés sur les écrits, photographies et œuvres d’art trouvés en ligne et créés par des milliards d’humains.

D’une certaine manière, l’IA emprunte à l’intelligence humaine et ne crée pas par elle-même. Si j'emprunte à un autre humain, je dois accorder du crédit et éventuellement payer des frais de licence. Avec l’IA générative, il devient plus difficile de citer une source car chaque texte ou image est décomposé en éléments diffus puis réassemblé pour créer une nouvelle pièce utilisant des milliers ou des millions de sources.

Nous devons soit repenser notre perception du droit d'auteur et du plagiat, soit trouver des outils permettant d'identifier le matériel généré par l'IA et éventuellement développer une méthode permettant d'attribuer du crédit au grand nombre de personnes qui contribuent à chaque œuvre générée par l'IA.