« Vous êtes ChatGPT » : une fuite d’invite système révèle le fonctionnement interne de GPT-5

Que s'est-il passé ? Une prétendue invite système GPT-5 a fuité sur Reddit et GitHub ce week-end. Cette invite révèle les règles exactes données à ChatGPT pour interagir avec les utilisateurs et effectuer diverses tâches.

  • Un utilisateur de Reddit affirme avoir découvert « l'invite système textuelle et les informations sur les outils » pour GPT-5 , le dernier grand modèle de langage (LLM) d'OpenAI.
  • L’intégralité de l’invite est également apparue sur GitHub un jour plus tôt.
  • L'invite commence par les mots : « Vous êtes ChatGPT, un grand modèle de langage basé sur le modèle GPT-5 et formé par OpenAI. »
  • Il précise ensuite la date limite de connaissance pour le GPT-5, qui serait 2024-06.
  • La personnalité est répertoriée comme « v2 », ce qui implique à juste titre que ChatGPT a subi quelques changements de personnalité au fil du temps.
  • Les commandes donnent beaucoup d'informations sur le type de réponses que ChatGPT est désormais autorisé à offrir et montrent comment l'entreprise essaie de façonner
  • Un changement notable ordonne à GPT-5 de ne pas dire ce qui suit : « Voudriez-vous que je fasse ; voulez-vous que je fasse cela ; voulez-vous que je le fasse ; si vous voulez, je peux ; faites-moi savoir si vous voulez que je le fasse ; devrais-je ; dois-je. »
  • Bien que les deux sources affirment que l'invite du système est 100 % réelle, les utilisateurs de Hacker News remettent en question son authenticité et sa reproductibilité, notant que des invites leurres/canaris sont possibles.

C'est important car : si le texte est réel, il offre un aperçu rare de la façon dont ChatGPT est dirigé ; s'il est faux, il montre à quel point il est facile de semer des « fuites » qui semblent plausibles.

  • Le système indique la forme, le ton, le comportement de sécurité et l'utilisation des outils.
  • Les fuites peuvent éclairer les tentatives de jailbreak, mais surtout, elles nous donnent un aperçu du fonctionnement interne des LLM.
  • Ces changements pourraient grandement contribuer à simplifier l'utilisation de GPT-5. Des outils d'automatisation, comme la création de tâches quotidiennes, sont également évoqués.
  • Cependant, les documents de lancement d'OpenAI mettent l'accent sur la pile de routeur/raisonnement de GPT-5, et non sur un seul script statique, ce qui porte atteinte à l'idée d'une invite canonique.

Pourquoi devrais-je m'en soucier ? Connaître le contenu exact de l'invite système donne à l'utilisateur un aperçu précis du type de données utilisées par GPT-5 et de la manière dont il y réagit.

  • L'invite système supposée montre quelques modifications apportées par OpenAI qui affectent la façon dont GPT-5 communique.
  • Cela inclut : « Si l’étape suivante est évidente, faites-la » et « Posez au plus une question de clarification nécessaire au début, pas à la fin. »
  • Il existe également de longues directives sur la génération d’images, y compris des images de vous-même.
  • L’authenticité n’est pas prouvée ; l’essentiel pourrait être partiel, obsolète ou intentionnellement semé.

OK, quelle est la prochaine étape ? La documentation et les fichiers système d'OpenAI seront constamment mis à jour.

  • Même si cette invite système est réelle, il y a de fortes chances qu'elle change à chaque version du modèle, et peut-être à chaque petite mise à jour envoyée au LLM.
  • OpenAI n'a publié ni confirmé aucune invite système ; les documents officiels GPT-5 décrivent un système routé, pas un script statique.