Gemini devient un outil créatif : l’édition d’images arrive en natif
Avec la possibilité d’envoyer un lot d’images en un clic

- Gemini de Google peut désormais modifier des images personnelles ou générées par IA à partir de simples consignes textuelles
- Les outils d’édition permettent des retouches précises grâce à l’intelligence artificielle
- Il est également possible de téléverser jusqu’à dix images ou fichiers en même temps
L’IA Gemini de Google sort pinceaux et toile pour enrichir la création d’images assistée par intelligence artificielle. Désormais, Gemini peut modifier des images directement dans son interface de chat. Il est aussi possible d’envoyer plusieurs images ou fichiers à la fois pour analyse.
Le nouvel éditeur permet d’appliquer des modifications à n’importe quelle image, qu’elle provienne de l’utilisateur ou qu’elle ait été générée par Gemini. Il suffit de demander les changements souhaités : transformer l’arrière-plan d’une photo de vacances pour faire disparaître une cuisine tristounette d’Airbnb au profit d’une falaise à Santorin, effacer une tache de moutarde sur une veste, ou même ajouter un chapeau rigolo sur la tête d’un chien, peu importe s’il le déteste en vrai.
Les retouches peuvent s’enchaîner au fil de la conversation avec Gemini, en superposant les changements. Chaque modification conserve les précédentes, évitant de tout recommencer si les dernières retouches ne sont pas concluantes.
Sous le capot, l’éditeur de Gemini combine plusieurs outils pour éviter les images incohérentes, pleines de textures contradictoires, de lumières mal assorties ou d’angles bancals. Google promet un rendu fidèle à la réalité, même quand l’imagination dépasse les bornes.
Selon l’entreprise, cet éditeur présente des avantages dans de nombreux domaines. Des enseignants peuvent rapidement créer des storyboards illustrés, des designers peuvent assembler un portfolio de produits, et des architectes visualiser des ajustements en pleine réunion.
L’éditeur s’ajoute à une autre nouveauté : la possibilité de téléverser jusqu’à dix images, PDF ou autres fichiers simultanément, pour permettre à Gemini d’en extraire une synthèse utile.
Imagination visuelle avec l’IA
On peut se demander comment Gemini va éviter les usages abusifs, comme la création de deepfakes représentant des personnes réelles ou des événements falsifiés. Google affirme avoir pris les devants : chaque image modifiée par IA est dotée non pas d’un, mais de deux filigranes. Le premier est visible, l’autre repose sur SynthID, un marquage invisible détectable uniquement par logiciel. Des filtres alimentés par des retours humains bloquent également les requêtes douteuses sur le plan éthique.
L’éditeur et la capacité de téléversement enrichie ne révolutionnent pas l’IA, mais ils renforcent l’utilité de Gemini. Il ne s’agit plus seulement de ce que l’IA peut dire, mais aussi de ce qu’elle permet de créer. Google investit fortement pour faire de Gemini un outil polyvalent et complet sur lequel il soit naturel de s’appuyer.
Plutôt que de voir Gemini comme un simple bloc-notes numérique ou un moteur de recherche avec un sens de l’humour, l’idée est de l’envisager comme un partenaire pour les tâches créatives et productives. Le jour où l’on pourra lui demander de "concevoir une carte d’anniversaire et de cuire le gâteau" n’est peut-être pas si lointain. En attendant, la possibilité de lui envoyer dix fichiers d’un coup et d’obtenir un résultat cohérent, tout en ajoutant un chapeau à son chien, constitue déjà un bon départ.
Vous aimerez aussi

Quand je ne suis pas en train de plonger dans le monde fascinant de la finance et des nouvelles technologies, vous me trouverez probablement en train de parcourir le globe ou de conquérir de nouveaux mondes virtuels sur ma console de jeux.
- Eric Hal SchwartzContributor