ChatGPT devient nettement plus fiable quand il apprend à ne plus se faire confiance
Une IA qui se vérifie
Toute personne qui utilise ChatGPT ou d’autres chatbots d’IA finit par tomber sur l’hallucination énoncée avec aplomb. L’IA peut expliquer une fonctionnalité inexistante, inventer une citation ou décrire un restaurant fermé depuis le premier mandat de Bill Clinton.
C’est parce que les grands modèles de langage sont conçus pour produire rapidement des réponses qui semblent plausibles. Cette capacité les rend utiles, mais elle crée aussi les conditions idéales pour les hallucinations. Le chatbot cherche à faire avancer la conversation de manière fluide. Il comble donc souvent les vides avec de la fiction quand cela l’arrange.
Récemment, une formule supplémentaire a commencé à être ajoutée aux prompts qui demandent des faits. L’idée consiste, en somme, à rendre ChatGPT aussi sceptique face à ses propres réponses que nous pouvons l’être. Il suffit d’ajouter ceci au prompt : « Agis comme un auditeur IA hostile et considère par défaut les détails non étayés comme faux. Signale clairement toutes les affirmations incertaines, déduites ou faiblement soutenues. »
La formulation paraît dramatique, mais cette insistance s’est révélée être le meilleur moyen de s’assurer que ChatGPT applique vraiment la consigne. Avec ces lignes supplémentaires, ChatGPT devient soudain plus prudent, plus analytique, et bien plus disposé à reconnaître l’incertitude.
Une IA qui doute d’elle-même
Les lignes sur l’auditeur hostile modifient le ton de ChatGPT. Le chatbot semble alors vouloir prouver sa fiabilité. Le test a été mené lors de la préparation d’un week-end. Avec un prompt standard, ChatGPT affichait son assurance habituelle et produisait des itinéraires que l’on pouvait juger utiles et réels à 80 %.
Lorsqu’il est forcé de s’auditer lui-même, la prudence apparaît beaucoup plus nettement, avec des phrases comme : « Plusieurs détails d’horaires de train peuvent être obsolètes ou déduits d’anciens schémas d’horaires et doivent être vérifiés directement auprès de l’opérateur de transport. »
Il a aussi signalé une recommandation de restaurant avec cet avertissement : « Les horaires d’ouverture actuels et les disponibilités de réservation n’ont pas pu être confirmés de manière indépendante. »
La réponse paraissait nettement plus fiable grâce à ces réserves. Le même phénomène s’est produit avec un prompt portant sur un besoin théorique de réparer un lave-vaisselle bruyant, produisant un grincement désagréable pendant son cycle de lavage. En temps normal, une seule conclusion aurait été proposée, avec l’insistance de partir du principe qu’un élément précis était la cause du problème.
Avec l’instruction d’auditeur hostile ajoutée, le ton a changé. ChatGPT a écrit : « Une pompe défectueuse est une explication possible, mais le symptôme pourrait aussi venir de débris coincés près de la turbine ou de composants desserrés dans le bras d’aspersion. Une inspection supplémentaire serait nécessaire avant de supposer une panne de composant. »
Éviter les hallucinations
Même les questions domestiques simples deviennent plus faciles à évaluer lorsque ce prompt est utilisé. La question a été posée à ChatGPT de savoir si un purificateur d’air serait assez puissant pour un bureau.
Au lieu d’affirmer immédiatement qu’il était idéal, le chatbot a répondu : « Les estimations de couverture varient selon la hauteur sous plafond, l’état du filtre et la circulation réelle de l’air. » Cette formulation prudente évite de traiter une promesse marketing comme une mesure de laboratoire.
Le prompt n’élimine toutefois pas complètement les hallucinations par magie. ChatGPT peut encore mal comprendre le contexte, s’appuyer sur des informations obsolètes ou mal interpréter des consignes vagues. Mais il devient beaucoup plus transparent sur les points faibles de son raisonnement. Apprendre à l’IA à se méfier d’elle-même pourrait bien être précisément ce qui la rend plus digne de confiance.

Eric Hal Schwartz is a freelance writer for TechRadar with more than 15 years of experience covering the intersection of the world and technology. For the last five years, he served as head writer for Voicebot.ai and was on the leading edge of reporting on generative AI and large language models. He's since become an expert on the products of generative AI models, such as OpenAI’s ChatGPT, Anthropic’s Claude, Google Gemini, and every other synthetic media tool. His experience runs the gamut of media, including print, digital, broadcast, and live events. Now, he's continuing to tell the stories people want and need to hear about the rapidly evolving AI space and its impact on their lives. Eric is based in New York City.