La nouvelle IA d’Apple peut modifier des images à partir de phrases en langage naturel

Par Alexandre Mathiot Le 08/02/2024 0 com

MGIE, le modèle d'IA introduit par Apple, promet de transformer l'édition d'images en interprétant des instructions textuelles, marquant une avancée majeure dans le domaine créatif assisté par intelligence artificielle pour l’entreprise.

L'évolution de l'IA dans le domaine de la création d'images a franchi des étapes significatives, notamment avec Bing Image Creator de Microsoft, offrant aux utilisateurs la possibilité de générer des images à partir de descriptions textuelles. Cette innovation, ainsi que les améliorations ultérieures en termes de vitesse et d'efficacité, témoignent de l'avancement rapide de l'entreprise dans l'utilisation de l'intelligence artificielle pour des applications créatives.

Microsoft a récemment dépassé Apple en termes de valorisation, principalement grâce à son engagement et à ses avancées significatives dans le domaine de l'intelligence artificielle, comme en témoignent les succès de ChatGPT-4 et Copilot Pro. Dans ce contexte, MGIE d'Apple apparaît comme une réponse stratégique visant à maintenir sa compétitivité dans le domaine de l'IA.

Apple présente un nouveau modèle d'édition d'images par IA

Fruit d'une collaboration entre Apple et des chercheurs de l'Université de Californie à Santa Barbara., MGIE (MLLM-Guided Image Editing) se distingue par sa capacité à comprendre et exécuter des commandes textuelles pour des manipulations précises au niveau des pixels. Cette capacité à transformer des instructions textuelles simples ou ambiguës en directives claires et précises ouvre de nouvelles possibilités pour l'édition d'images intuitives. Présenté lors de la conférence ICLR 2024, ce modèle démontre une efficacité remarquable. Il offre des résultats précis qui ont été approuvés par les utilisateurs, tout en fonctionnant rapidement et sans gaspiller de ressources.

MGIE se distingue par sa capacité à réaliser une large gamme de modifications d'images, allant de simples ajustements de couleurs à des transformations complexes d'objets. Le modèle optimise également les photos de manière globale et permet des retouches ciblées sur des zones spécifiques. Il excelle dans le recadrage, le redimensionnement, la rotation des images, ainsi que l'ajustement de la luminosité, du contraste et de la balance des couleurs, le tout à partir de simples prompts textuels. Disponible en open source, ce programme est facile d'accès via GitHub, avec des ressources supplémentaires comme un notebook de démonstration et une démo web sur Hugging Face Spaces, rendant son utilisation pratique pour diverses applications d'édition.

Source : arxiv

Abonnez-vous gratuitement à la newsletter

Réagissez à cet article !

Voir tous les commentaires

Demandez nos derniers articles !

Ce clip vidéo réalisé par l’IA Sora est impressionnant, si l’on ne s’attarde pas sur certains détails
Le dernier clip musical réalisé avec Sora, pour l’artiste Washed Out, démontre les avancées de l’IA dans la production artistique. Son directeur, Paul Trillo, a utilisé cette technologie pour concrétiser une idée qu’il avait en tête depuis près d’une décennie….

IA 03/05/2024
ChatGPT : OpenAI lancerait son moteur de recherche boosté à l’IA le 9 mai, tremble Google !
Ça commence sérieusement à se concrétiser pour le moteur de recherche estampillé ChatGPT. Des internautes ont en effet repéré une URL qui laisse fortement penser que le nom de domaine est déjà réservé par OpenAI. Pendant ce temps, un utilisateur…

IA 03/05/2024
ChatGPT : l’IA est plus humaine que certains étudiants, cette étude surprenante le prouve
Lorsqu’il s’agit d’évaluer les capacités de grands modèles de langage comme ChatGPT, la plupart des études se concentrent sur leur capacité à extraire des informations factuelles, à s’engager dans un raisonnement logique ou à faire preuve d’une expression créative semblable…

IA 02/05/2024
Ce prof utilise l’IA pour faire virer le proviseur de son lycée, les conséquences sont massives
Un professeur d’EPS s’est servi d’un outil IA pour générer un message haineux avec la voix de son proviseur dans le but de lui faire perdre son poste. Il avait presque réussi, mais depuis, tout l’établissement subit les conséquences. La…

IA 26/04/2024
ChatGPT : l’application Android et iOS rattrape enfin son retard sur la version web avec cette fonctionnalité essentielle
Dans une prochaine mise à jour, les utilisateurs smartphone de ChatGPT vont enfin profiter d’une fonctionnalité disponible uniquement sur la version web. Une raison de plus de n’utiliser l’IA que sur Android ou iOS. À bien des égards, il est…

IA 25/04/2024
Adobe lance une IA qui va faire disparaitre les vidéos floues d’Internet
Le dernier projet d’intelligence artificielle issu des laboratoires de recherche d’Adobe vise à débarrasser définitivement le monde des vidéos floues et pixellisées. Voici ce que l’on sait à son sujet. Adobe vient de lever le voile sur VideoGigaGAN, un nouveau…

IA 25/04/2024
Arnaque ou non ? La CPAM sème le doute en faisant signer ses courriers par un robot
Un assuré installé dans les Landes a reçu en janvier 2024 un courrier de la CPAM. Devant la signature étrange, il pense rapidement à une arnaque. Alors, escroquerie confirmée ou simple erreur de la caisse d’assurance maladie ? Bernard Larrat,…

IA 24/04/2024
Bonne nouvelle, l’IA Gemini de Google pourrait tourner sur votre vieux smartphone
Un récent changement dans l’intelligence artificielle Gemini de Google laisse penser qu’elle sera utilisable même sur des smartphones datant de plusieurs années. Pas besoin d’acheter le dernier modèle en date pour en profiter. Il n’y a pas si longtemps, Google…

IA 24/04/2024
IA : Photoshop peut générer des images à partir de textes, plus besoin de maîtriser l’outil
Grâce à l’intégration de l’intelligence artificielle directement dans Photoshop, le logiciel devient capable de créer des images à partir de requêtes écrites. Son utilisation est à la portée de tous. Adobe, entreprise connue pour ces logiciels de création comme Photoshop,…

IA 23/04/2024
Gemini : l’IA de Google va vous répondre encore plus rapidement qu’avant sur Android
Bonne nouvelle pour les utilisateurs de l’application Gemini, la nouvelle IA de Google, puisque le géant américain vient de la mettre à jour pour lui permettre de vous répondre « en temps réel ». L’assistant chatbot Gemini de Google n’a pas vraiment…

IA 22/04/2024

Newsletter