Adieu Photoshop ? Cette IA vous permet d’éditer vos photos à partir d’un prompt

Adieu Photoshop ? Google vient de lancer une nouvelle IA capable de modifier vos images sur simple demande vocale. Fini les heures passées à maîtriser des logiciels complexes, il suffit maintenant de demander à l'IA d'ajouter un chapeau à votre grand-mère ou de transformer votre salon en jungle tropicale.

Gemini
Crédits : 123RF

Google vient d’améliorer Gemini 2.0 Flash, un modèle capable de générer et d'éditer des images aussi facilement qu'il crée du texte. Une nouveauté sur l’IA de Google, qui s'intègre directement dans une interface de chatbot, promet de démocratiser l'édition d'images et de bouleverser notre rapport à la retouche photographique.

Lancé la semaine dernière et désormais accessible à tous via Google AI Studio, Gemini 2.0 Flash se distingue par sa capacité à traiter à la fois le texte et l'image au sein d'un même modèle d'IA. Cette approche multimodale marque une rupture avec les solutions existantes, qui faisaient généralement appel à des modèles distincts pour la génération de texte et d'images.

Lire égalementGemini peut désormais lire des vidéos YouTube à votre place, voici comment ça marche

Gemini 2.0 Flash se veut encore plus polyvalent qu’avant

Les capacités de Gemini 2.0 Flash en termes de retouche photo sont vastes et variées :

  • Ajout ou suppression d'objets dans une image
  • Modification des décors et de l'éclairage
  • Changement d'angle de vue
  • Zoom avant ou arrière
  • Suppression de filigranes (bien que cela puisse affecter la qualité de l'image)

D’après Google, cette polyvalence est rendue possible grâce à un entraînement sur un vaste ensemble de données combinant images et textes. Le modèle intègre ainsi une compréhension profonde des concepts visuels et textuels, lui permettant de générer directement des images en réponse aux requêtes des utilisateurs.

L'approche de Google se démarque de celle d'autres géants de la tech comme OpenAI, qui utilise des modèles distincts pour le texte (ChatGPT) et l'image (DALL-E). D'un point de vue technique, vous l’imaginez, le traitement simultané du texte et de l'image est extrêmement gourmand en ressources de calcul. Cela explique en partie pourquoi la qualité des images générées par Gemini 2.0 Flash n'atteint pas encore celle des modèles spécialisés comme DALL-E.

La mauvaise nouvelle, c’est que sur le plan éthique, la facilité avec laquelle ces modèles multimodaux peuvent manipuler des images soulève des inquiétudes légitimes. La création de deepfakes convaincants ou la manipulation de photos à des fins malveillantes pourraient devenir encore plus simples, ce qui pose de nouveaux défis en matière de désinformation et de protection de la vie privée.


Abonnez-vous gratuitement à la newsletter

Chaque jour, le meilleur de Phonandroid dans votre boite mail !

Réagissez à cet article !

Demandez nos derniers articles !

Boulanger propose l’iPhone 16 Pro Max à un prix record : une offre à ne pas manquer

L’iPhone 16 Pro Max est à son prix le plus bas sur Boulanger. Le smartphone d’Apple voit son prix fondre de plus de 400 € et passe sous la barre…

La mise à jour Linux 7.0 bientôt disponible, de meilleures performances gaming et bureautique à la clé

La mise à jour vers Linux 7.0 va permettre d’améliorer les performances des jeux et des logiciels lourds. Cette version valide aussi définitivement l’usage de Rust comme langage de programmation…

PC

Bon plan Pure Electric Escape 350 W : la trottinette électrique urbaine chute à moins de 300 €

Vous en avez marre des transports en commun bondés et trop souvent en retard ? Vous n’en pouvez plus d’attendre dans les bouchons ? Nous avons trouvé pour vous une…

Avec 75% de réduction, ce casque sans fil Xbox Series chute à moins de 20 euros, c’est à peine croyable !

C’est une baisse de prix spectaculaire pour le casque sans fil PDP Phantom compatible Xbox Series S/X. Il voit son prix chuter de 75% sur le site de la Fnac….

Google Maps : en manque d’aventures ? Cette option dopée à l’IA se charge de vous proposer des idées

La firme de Mountain View poursuit le développement de son application GPS phare : Google Maps. Le géant de la tech s’apprête à y introduire une nouvelle fonction expérimentale : Ask Maps….

YouTube Music Premium accueille une fonction IA très pratique pour créer des playlists personnalisées

YouTube continue d’enrichir les avantages réservés à ses abonnés Premium. Une nouvelle fonction permet désormais de créer des playlists générées par intelligence artificielle. Il suffit d’écrire ou de dire une…

Voici les fiches techniques complètes des Galaxy S26, S26+ et S26 Ultra

À deux semaines de leur annonce officielle, les Galaxy S26, S26+ et S26 Ultra n’ont déjà plus de secret pour nous. Découvrez toutes leurs caractéristiques techniques. On se rapproche doucement…

Safer Internet Day 2026 : quelles sont les clés pour rendre Internet plus sûr pour vos enfants ?

La Journée internationale pour un Internet plus sûr, ou Safer Internet Day, se tient chaque année le deuxième mardi du mois de février. Cet événement vise, entre autres, à sensibiliser…

Google évoque FaceTime pour le Pixel 10a, mais ce n’est pas ce que vous croyez

Le Pixel 10a arrive bientôt et fait déjà parler de lui. Sa fiche produit évoque une compatibilité avec FaceTime, ce qui intrigue de nombreux utilisateurs. En réalité, cette mention cache…

Windows 11 : la dernière mise à jour de PowerToys apporte son lot d’améliorations bienvenues

Microsoft met régulièrement à jour son célèbre utilitaire : PowerToys, qui en est désormais à la version 0.97. C’est maintenant au tour d’une mise à jour corrective d’être déployée : voici ce…