Adieu Photoshop ? Cette IA vous permet d’éditer vos photos à partir d’un prompt

Adieu Photoshop ? Google vient de lancer une nouvelle IA capable de modifier vos images sur simple demande vocale. Fini les heures passées à maîtriser des logiciels complexes, il suffit maintenant de demander à l'IA d'ajouter un chapeau à votre grand-mère ou de transformer votre salon en jungle tropicale.

Gemini
Crédits : 123RF

Google vient d’améliorer Gemini 2.0 Flash, un modèle capable de générer et d'éditer des images aussi facilement qu'il crée du texte. Une nouveauté sur l’IA de Google, qui s'intègre directement dans une interface de chatbot, promet de démocratiser l'édition d'images et de bouleverser notre rapport à la retouche photographique.

Lancé la semaine dernière et désormais accessible à tous via Google AI Studio, Gemini 2.0 Flash se distingue par sa capacité à traiter à la fois le texte et l'image au sein d'un même modèle d'IA. Cette approche multimodale marque une rupture avec les solutions existantes, qui faisaient généralement appel à des modèles distincts pour la génération de texte et d'images.

Lire égalementGemini peut désormais lire des vidéos YouTube à votre place, voici comment ça marche

Gemini 2.0 Flash se veut encore plus polyvalent qu’avant

Les capacités de Gemini 2.0 Flash en termes de retouche photo sont vastes et variées :

  • Ajout ou suppression d'objets dans une image
  • Modification des décors et de l'éclairage
  • Changement d'angle de vue
  • Zoom avant ou arrière
  • Suppression de filigranes (bien que cela puisse affecter la qualité de l'image)

D’après Google, cette polyvalence est rendue possible grâce à un entraînement sur un vaste ensemble de données combinant images et textes. Le modèle intègre ainsi une compréhension profonde des concepts visuels et textuels, lui permettant de générer directement des images en réponse aux requêtes des utilisateurs.

L'approche de Google se démarque de celle d'autres géants de la tech comme OpenAI, qui utilise des modèles distincts pour le texte (ChatGPT) et l'image (DALL-E). D'un point de vue technique, vous l’imaginez, le traitement simultané du texte et de l'image est extrêmement gourmand en ressources de calcul. Cela explique en partie pourquoi la qualité des images générées par Gemini 2.0 Flash n'atteint pas encore celle des modèles spécialisés comme DALL-E.

La mauvaise nouvelle, c’est que sur le plan éthique, la facilité avec laquelle ces modèles multimodaux peuvent manipuler des images soulève des inquiétudes légitimes. La création de deepfakes convaincants ou la manipulation de photos à des fins malveillantes pourraient devenir encore plus simples, ce qui pose de nouveaux défis en matière de désinformation et de protection de la vie privée.


Réagissez à cet article !

Demandez nos derniers articles !

Voiture électrique : Lexus rattrape enfin Tesla en ajoutant cette option fondamentale

Il était temps que les voitures électriques Lexus se mettent au niveau de la concurrence. Surtout au niveau d’une fonction très utilisée ailleurs depuis des années et totalement absente des…

Huawei Watch FIT 5 Pro : trail, vélo, running… cette montre connectée veut tout faire en mieux

Trail, vélo, running… Huawei revoit sa copie avec la Watch FIT 5 Series et des modes sport bien plus étoffés qu’attendu. La version Pro veut convaincre les sportifs réguliers avec…

Des pirates utilisent l’IA pour trouver une faille zero-day et l’exploiter

Les experts en cybersécurité de chez Google ont découvert la première utilisation documentée de l’IA pour trouver une faille zero-day. C’est-à-dire une vulnérabilité dont les développeurs du produit visé n’ont…

IA

Le lancement de la bêta publique de One UI 9 est imminent, ces indices le prouvent

Samsung multiplie les actions qui laissent à penser que la bêta publique de One UI 9 ne va plus tarder à arriver. Pour l’heure, on ne sait pas encore quels…

Vos messages Android vers iPhone sont enfin chiffrés de bout en bout grâce à cette collaboration inédite

Depuis des années, envoyer un message d’un Android vers un iPhone revenait à envoyer une carte postale. N’importe qui pouvait le lire en chemin. iOS 26.5 vient enfin de fermer…

YouTube va vous permettre de retirer tous les éléments d’interface pour enfin voir correctement vos Shorts

YouTube travaille actuellement sur une option qui permet de retirer tout ce qui s’affiche sur votre écran lorsque vous visionnez des Shorts. Une fonctionnalité directement inspirée par ce que propose…

Android Show I/O 2026 : comment suivre en direct les nouvelles annonces d’Android 17

Aujourd’hui se tiendra l’Android Show I/O 2026, l’événement consacré aux prochaines nouveautés du système d’exploitation. Heure, annonces attendues et lien du stream, retrouvez dans cet article toutes les informations nécessaires…

Honor, Oppo et Vivo prépareraient des smartphones pliables en largeur

Décidément, tout le monde veut son smartphone pliable au format livre. Après Huawei et Samsung, des “tipsters” affirment que trois autres fabricants préparent leur propre modèle. Apple a souvent mis…

Une mise à jour de Chrome force une barre inutile sur votre page d’accueil sans que vous puissiez l’enlever

Chrome 148 vient de débarquer avec un défaut gênant pour ceux qui aiment une interface épurée. Une barre s’affiche en permanence sur le nouvel onglet, résistant à tous les réglages….

TikTok lance un abonnement payant pour supprimer les pubs

C’est officiel, il sera bientôt possible de payer pour ne plus voir de publicités dans le réseau social TikTok, mais pas (encore) partout. Combien ça coûte ? Qui peut y…