Adieu Photoshop ? Cette IA vous permet d’éditer vos photos à partir d’un prompt

Adieu Photoshop ? Google vient de lancer une nouvelle IA capable de modifier vos images sur simple demande vocale. Fini les heures passées à maîtriser des logiciels complexes, il suffit maintenant de demander à l'IA d'ajouter un chapeau à votre grand-mère ou de transformer votre salon en jungle tropicale.

Gemini
Crédits : 123RF

Google vient d’améliorer Gemini 2.0 Flash, un modèle capable de générer et d'éditer des images aussi facilement qu'il crée du texte. Une nouveauté sur l’IA de Google, qui s'intègre directement dans une interface de chatbot, promet de démocratiser l'édition d'images et de bouleverser notre rapport à la retouche photographique.

Lancé la semaine dernière et désormais accessible à tous via Google AI Studio, Gemini 2.0 Flash se distingue par sa capacité à traiter à la fois le texte et l'image au sein d'un même modèle d'IA. Cette approche multimodale marque une rupture avec les solutions existantes, qui faisaient généralement appel à des modèles distincts pour la génération de texte et d'images.

Lire égalementGemini peut désormais lire des vidéos YouTube à votre place, voici comment ça marche

Gemini 2.0 Flash se veut encore plus polyvalent qu’avant

Les capacités de Gemini 2.0 Flash en termes de retouche photo sont vastes et variées :

  • Ajout ou suppression d'objets dans une image
  • Modification des décors et de l'éclairage
  • Changement d'angle de vue
  • Zoom avant ou arrière
  • Suppression de filigranes (bien que cela puisse affecter la qualité de l'image)

D’après Google, cette polyvalence est rendue possible grâce à un entraînement sur un vaste ensemble de données combinant images et textes. Le modèle intègre ainsi une compréhension profonde des concepts visuels et textuels, lui permettant de générer directement des images en réponse aux requêtes des utilisateurs.

L'approche de Google se démarque de celle d'autres géants de la tech comme OpenAI, qui utilise des modèles distincts pour le texte (ChatGPT) et l'image (DALL-E). D'un point de vue technique, vous l’imaginez, le traitement simultané du texte et de l'image est extrêmement gourmand en ressources de calcul. Cela explique en partie pourquoi la qualité des images générées par Gemini 2.0 Flash n'atteint pas encore celle des modèles spécialisés comme DALL-E.

La mauvaise nouvelle, c’est que sur le plan éthique, la facilité avec laquelle ces modèles multimodaux peuvent manipuler des images soulève des inquiétudes légitimes. La création de deepfakes convaincants ou la manipulation de photos à des fins malveillantes pourraient devenir encore plus simples, ce qui pose de nouveaux défis en matière de désinformation et de protection de la vie privée.


Réagissez à cet article !

Demandez nos derniers articles !

« Nous disons adieu à l’application Sora » : OpenAI va bientôt fermer son célèbre générateur de vidéos IA

Sora est la plateforme autonome de génération de vidéos par IA d’OpenAI. Lancée à la fin de l’année 2024, elle a suscité un véritable engouement, mais la maison-mère de ChatGPT…

IA

Spider-Man Brand New Day n’est pas encore sorti qu’il vient de pulvériser un record historique, même GTA 6 ne fait pas le poids

La semaine dernière, Sony dévoilait la première bande-annonce du prochain film Spider-Man, Brand New Day. Il ne lui a fallu que 24 heures pour battre un record historique, scellant d’ores…

Disney+ : la saison 2 de Daredevil : Born Again est disponible sur la plateforme de streaming !

Disney+ est une plateforme de streaming vidéo très vivante avec des nouveautés qui enrichissent le catalogue très régulièrement comme des films récents, des dessins animés, des classiques du cinéma ou…

Meilleure vente de Pâques : une licence Office 2021 Pro pour seulement 30 € ! Offre spéciale sur Windows 11 Pro à 12 € !

Licences Microsoft à prix cassés, sans abonnement : Office 2021 Professional à 30,25 € à vie et Windows 11 Pro à 12,25 €. Godeal24 propose des offres à durée limitée…

ChatGPT se dote d’une nouveauté qui fait toute la différence pour les utilisateurs réguliers

ChatGPT dispose désormais d’une bibliothèque regroupant les fichiers qu’on lui a partagés, ainsi que ceux que l’IA a générés elle-même. Un espace bien pratique pour s’organiser plus efficacement. ChatGPT est…

IA

Ces 6 produits Apple seront bientôt disponibles, l’attente va prendre fin

Dans les prochains mois, Apple devrait lancer bon nombre de nouveaux produits sur le marché. Voici 6 appareils qui sont attendus, en laissant de côté les stars que sont l’iPhone…

iOS 26.4 est disponible, voici les nouveautés qui arrivent sur votre iPhone

Apple déploie la mise à jour vers iOS 26.4. Cette version apporte de nouvelles fonctionnalités et des correctifs de sécurité à l’iPhone. En bêta depuis mi-février, iOS 26.4 est désormais…

À quelques mois de la Coupe du Monde, Samsung annonce ses nouvelles Smart TV

Samsung présente ses nouvelles Smart TV, qui seront bientôt mises à la vente. Les modèles Mini LED sont mis à l’honneur dans cette annonce, stratégique, à quelques mois du début…

TV

Quelque chose ne tourne plus rond sur les Google Pixel depuis la mise à jour de mars

Les Google Pixel accumulent les mauvaises surprises depuis la mise à jour de mars. Un nouveau bug vient s’ajouter aux problèmes déjà signalés. Cette fois, ce sont les automatisations de…

AliExpress baisse drastiquement ses prix pour son anniversaire : dernière chance pour profiter des meilleures promos du moment

Dans quelques heures, AliExpress baissera le rideau sur son plus gros événement bon plan de ce début d’années.  Les promos disponibles dans le cadre de son anniversaire prennent fin ce…