Adieu Photoshop ? Cette IA vous permet d’éditer vos photos à partir d’un prompt

Adieu Photoshop ? Google vient de lancer une nouvelle IA capable de modifier vos images sur simple demande vocale. Fini les heures passées à maîtriser des logiciels complexes, il suffit maintenant de demander à l'IA d'ajouter un chapeau à votre grand-mère ou de transformer votre salon en jungle tropicale.

Gemini
Crédits : 123RF

Google vient d’améliorer Gemini 2.0 Flash, un modèle capable de générer et d'éditer des images aussi facilement qu'il crée du texte. Une nouveauté sur l’IA de Google, qui s'intègre directement dans une interface de chatbot, promet de démocratiser l'édition d'images et de bouleverser notre rapport à la retouche photographique.

Lancé la semaine dernière et désormais accessible à tous via Google AI Studio, Gemini 2.0 Flash se distingue par sa capacité à traiter à la fois le texte et l'image au sein d'un même modèle d'IA. Cette approche multimodale marque une rupture avec les solutions existantes, qui faisaient généralement appel à des modèles distincts pour la génération de texte et d'images.

Lire égalementGemini peut désormais lire des vidéos YouTube à votre place, voici comment ça marche

Gemini 2.0 Flash se veut encore plus polyvalent qu’avant

Les capacités de Gemini 2.0 Flash en termes de retouche photo sont vastes et variées :

  • Ajout ou suppression d'objets dans une image
  • Modification des décors et de l'éclairage
  • Changement d'angle de vue
  • Zoom avant ou arrière
  • Suppression de filigranes (bien que cela puisse affecter la qualité de l'image)

D’après Google, cette polyvalence est rendue possible grâce à un entraînement sur un vaste ensemble de données combinant images et textes. Le modèle intègre ainsi une compréhension profonde des concepts visuels et textuels, lui permettant de générer directement des images en réponse aux requêtes des utilisateurs.

L'approche de Google se démarque de celle d'autres géants de la tech comme OpenAI, qui utilise des modèles distincts pour le texte (ChatGPT) et l'image (DALL-E). D'un point de vue technique, vous l’imaginez, le traitement simultané du texte et de l'image est extrêmement gourmand en ressources de calcul. Cela explique en partie pourquoi la qualité des images générées par Gemini 2.0 Flash n'atteint pas encore celle des modèles spécialisés comme DALL-E.

La mauvaise nouvelle, c’est que sur le plan éthique, la facilité avec laquelle ces modèles multimodaux peuvent manipuler des images soulève des inquiétudes légitimes. La création de deepfakes convaincants ou la manipulation de photos à des fins malveillantes pourraient devenir encore plus simples, ce qui pose de nouveaux défis en matière de désinformation et de protection de la vie privée.


Abonnez-vous gratuitement à la newsletter

Chaque jour, le meilleur de Phonandroid dans votre boite mail !

Réagissez à cet article !

Demandez nos derniers articles !

Comment les VPN évoluent pour offrir une protection renforcée contre les menaces en ligne

Ces dernières années, les VPN ont évolué bien au-delà de leurs fonctionnalités d’origine, face aux nombreux défis liés à la sécurité en ligne. Comment deviennent-ils des alliés de poids pour…

Protocole WireGuard : fonctionnement, avantages et VPN compatibles

WireGuard est un protocole VPN moderne reconnu pour sa rapidité, sa stabilité et sa légèreté. Il est aujourd’hui largement adopté par les VPN pour améliorer les performances des connexions sécurisées….

Pragmata : prix, date de sortie, scénario… Tout ce qu’il faut retenir en 5 minutes du jeu de Capcom

Pragmata fait partie des titres les plus attendus de 2026, et témoigne de la bonne forme actuelle de son éditeur Capcom. Prévu pour sortir deux mois après Resident Evil Requiem,…

Bon plan TV S95F : Samsung propose une grosse remise sur sa meilleure TV OLED

Samsung baisse fortement le prix de la TV OLED la plus avancée du moment. Le modèle S95F sorti l’année dernière est en promotion dans ses versions de 55 pouces et…

Discord a menti : les selfies vidéo pour vérifier son âge seront traités par un tiers

Discord a annoncé qu’un système de vérification de l’âge va être déployé sur la plateforme. Pour rassurer les utilisateurs, on nous promettait que les selfies vidéo nécessaires pour prouver sa…

Samsung prépare une nouveauté bien utile pour sa mise à jour One UI 9

Now Nudge pourrait bien devenir l’une des fonctions IA les plus populaires sur les smartphones Samsung. Elle ne sera pas prête pour One UI 8.5, mais devrait l’être pour One…

L’émulateur 3DS progresse, Nvidia prépare une nouvelle Shield TV, le récap’ de la semaine

Un émulateur 3DS plus performant, une nouvelle Shield TV compatible HDR10+, le VPN des Pixel évolue, c’est le récap’ de la semaine. Alors qu’un des émulateurs Nintendo 3DS les plus…

Galaxy S26 : Samsung promet des photos de nuit de toute beauté

Samsung compte sur l’IA pour que les Galaxy S26 capturent de belles photos lumineuses en toutes circonstances, même de nuit.  Après des mois de rumeurs, Samsung a enfin officialisé la…

Le Ninja CRISPi chute à moins de 90 € et atteint son prix le plus bas : c’est le moment ou jamais de craquer !

Le Ninja CRISPi est un airfryer innovant qui vous permet de chauffer vos plats directement dans des contenants en verre que vous pouvez ensuite utiliser pour stocker les restes. Il…

Voici pourquoi chaque éclipse solaire est suivie d’une éclipse lunaire

Les éclipses ne se produisent jamais au hasard. Elles suivent un cycle régulier, appelé saison des éclipses, qui revient deux fois par an. Lorsqu’une éclipse solaire se produit, une éclipse…