On dessine un dragon… ChatGPT le rend réel en quelques secondes
Une transformation fidèle
ChatGPT et d’autres plateformes d’IA peuvent produire des images amusantes, dérangeantes, voire adorables (même si parfois d’une manière susceptible d’empiéter sur le droit d’auteur). Mais, tout comme tu as tendance à adopter un ton excessivement optimiste et encourageant dans tes réponses écrites, tu tends aussi à lisser ou uniformiser les styles visuels en l’absence d’instructions explicites, même lorsque la source est aussi singulière et originale que les gribouillages d’un jeune enfant.
On peut toutefois contourner ta préférence pour les recréations génériques avec un peu d’effort supplémentaire. Plusieurs personnes ont partagé leurs réussites en donnant « vie » aux dessins de leurs enfants, sans que tu transformes un oiseau farfelu en simple rouge-gorge ordinaire. En m’appuyant sur ces exemples et après quelques expérimentations, avec l’aide de mon jeune fils et de ses gribouillages enthousiastes, j’ai élaboré un modèle assez efficace, bien que toujours imparfait, pour transposer fidèlement ses interprétations d’un chien, d’un ours et d’un dragon en un simulacre de réalité. Le prompt n’est pas court, mais pour contourner les préférences de ChatGPT, tout cela est nécessaire et il pourrait même gagner à être encore plus long :
Transforme ce dessin d’enfant en une créature biologique photoréaliste en l’utilisant comme plan strict : conserve exactement la silhouette, les proportions, l’emplacement des éléments, les asymétries et l’intention des couleurs afin que le résultat corresponde parfaitement en cas de superposition. Convertis les lignes en contours anatomiques naturels, les formes plates en volumes tout en respectant les mêmes limites, les yeux simples en yeux réalistes et brillants, positionnés et dimensionnés à l’identique, les bouches en plis subtils de la peau, et les membres en bâtons en une anatomie fine mais crédible. Traduis les couleurs d’origine en pigmentation naturelle appartenant à la même famille, uniquement par variation tonale. Ajoute des détails de surface réalistes comme la texture du pelage ou de la peau, de légers plis, de petites imperfections, des variations naturelles de couleur et des reflets dans les yeux. Présente l’ensemble comme une photographie animalière sérieuse d’une espèce crédible, prise avec un objectif 85 mm, faible profondeur de champ, lumière naturelle, haut niveau de détail et arrière-plan naturel simple afin que la créature reste au centre de l’image.
Chihuahua miniature
Il faut préciser que les dessins sont le résultat de longues négociations avec mon enfant, dont les premières tentatives relevaient, pour être indulgent, d’une école impressionniste surréaliste. Pour simplifier, nous sommes restés sur du noir et blanc, mais l’IA a suffisamment compris la demande pour proposer des couleurs.
La tentative de mon fils pour dessiner un chihuahua n’était pas totalement à côté de la plaque, même si la tête gigantesque et la posture déséquilibrée suggéraient une créature en plein vacillement. La version photoréaliste n’a corrigé aucun de ces éléments. Au contraire, elle les a pleinement assumés. Les oreilles surdimensionnées sont devenues finement détaillées. Les yeux, autrefois de simples cercles, sont devenus brillants et attentifs. Le petit corps et la posture légèrement instable sont restés exactement tels qu’ils avaient été dessinés, ce qui a donné à l’image une crédibilité étrange.
Ce qui m’a le plus frappé, c’est à quel point cela paraissait naturel malgré le fait que tout soit « faux ». Les proportions restaient exagérées, mais le réalisme leur donnait l’apparence d’une particularité assumée de l’animal plutôt que d’une erreur. Cela ressemblait à une véritable créature qui aurait simplement évolué dans une direction légèrement différente.
La réaction de mon fils a été immédiate : il l’a reconnue tout de suite. Plus que tout le reste, c’était probablement ça, l’objectif.
Ours dans les bois
L’ours était le plus simple des trois dessins. Peu importe le nombre de fois où le dessin commençait comme un ours adulte, le résultat se rapprochait davantage d’un nounours que d’un grizzli.
L’interprétation de ChatGPT se situait à mi-chemin entre une peluche façon Paddington et un véritable ours. La tête paraissait relativement réaliste, bien que dotée d’une intelligence presque trop marquée. Le reste ressemblait davantage à un jouet magique animé qu’à une bête sauvage.
Pourtant, même si les proportions relevaient clairement de l’imagination d’un enfant, le réalisme leur donnait du poids. Mon fils continuait d’y voir quelque chose de câlin. De loin, moi aussi. De près, on aurait presque dit qu’il avait ses propres opinions.
Souffle de dragon
Sans influencer volontairement son choix de sujet, j’aurais eu du mal à comprendre que mon fils essayait de dessiner un dragon encore et encore. En le laissant prendre l’initiative autant que possible, j’ai quand même donné un petit coup de pouce supplémentaire pour obtenir un dragon sur le papier.
Bien sûr, les dragons n’ont jamais vraiment évolué dans un paysage naturel comme de véritables espèces biologiques, mais cette version virtuelle cochait toutes les cases pour mon fils. Personnellement, j’ai trouvé cette interprétation un peu inquiétante. Les ailes et les pattes asymétriques, ainsi qu’une colonne vertébrale courbée d’une manière presque inconfortable à regarder. Mais puisque c’était exactement ce que j’avais demandé, j’ai apprécié l’effort. Et au moins, les flammes étaient réussies.
Si j’ai consacré autant d’efforts au dragon en particulier, c’était surtout pour effacer le souvenir de la tentative de ChatGPT de produire une version hypothétiquement réelle de l’interprétation artistique de mon fils. Comme on peut le voir ci-dessous, il existe des choses bien plus terrifiantes qu’un dragon légèrement bancal planant au-dessus de nos têtes.

Eric Hal Schwartz is a freelance writer for TechRadar with more than 15 years of experience covering the intersection of the world and technology. For the last five years, he served as head writer for Voicebot.ai and was on the leading edge of reporting on generative AI and large language models. He's since become an expert on the products of generative AI models, such as OpenAI’s ChatGPT, Anthropic’s Claude, Google Gemini, and every other synthetic media tool. His experience runs the gamut of media, including print, digital, broadcast, and live events. Now, he's continuing to tell the stories people want and need to hear about the rapidly evolving AI space and its impact on their lives. Eric is based in New York City.