La nouvelle IA d’Apple peut modifier des images à partir de phrases en langage naturel

MGIE, le modèle d'IA introduit par Apple, promet de transformer l'édition d'images en interprétant des instructions textuelles, marquant une avancée majeure dans le domaine créatif assisté par intelligence artificielle pour l’entreprise.

ia photos apple
Source : arxiv

L'évolution de l'IA dans le domaine de la création d'images a franchi des étapes significatives, notamment avec Bing Image Creator de Microsoft, offrant aux utilisateurs la possibilité de générer des images à partir de descriptions textuelles. Cette innovation, ainsi que les améliorations ultérieures en termes de vitesse et d'efficacité, témoignent de l'avancement rapide de l'entreprise dans l'utilisation de l'intelligence artificielle pour des applications créatives.

Microsoft a récemment dépassé Apple en termes de valorisation, principalement grâce à son engagement et à ses avancées significatives dans le domaine de l'intelligence artificielle, comme en témoignent les succès de ChatGPT-4 et Copilot Pro. Dans ce contexte, MGIE d'Apple apparaît comme une réponse stratégique visant à maintenir sa compétitivité dans le domaine de l'IA.

Apple présente un nouveau modèle d'édition d'images par IA

Fruit d'une collaboration entre Apple et des chercheurs de l'Université de Californie à Santa Barbara., MGIE (MLLM-Guided Image Editing) se distingue par sa capacité à comprendre et exécuter des commandes textuelles pour des manipulations précises au niveau des pixels. Cette capacité à transformer des instructions textuelles simples ou ambiguës en directives claires et précises ouvre de nouvelles possibilités pour l'édition d'images intuitives. Présenté lors de la conférence ICLR 2024, ce modèle démontre une efficacité remarquable. Il offre des résultats précis qui ont été approuvés par les utilisateurs, tout en fonctionnant rapidement et sans gaspiller de ressources.

MGIE se distingue par sa capacité à réaliser une large gamme de modifications d'images, allant de simples ajustements de couleurs à des transformations complexes d'objets. Le modèle optimise également les photos de manière globale et permet des retouches ciblées sur des zones spécifiques. Il excelle dans le recadrage, le redimensionnement, la rotation des images, ainsi que l'ajustement de la luminosité, du contraste et de la balance des couleurs, le tout à partir de simples prompts textuels. Disponible en open source, ce programme est facile d'accès via GitHub, avec des ressources supplémentaires comme un notebook de démonstration et une démo web sur Hugging Face Spaces, rendant son utilisation pratique pour diverses applications d'édition.

Source : arxiv


Abonnez-vous gratuitement à la newsletter

Chaque jour, le meilleur de Phonandroid dans votre boite mail !

Réagissez à cet article !

Demandez nos derniers articles !

Samsung Galaxy S26 : fenêtre de sortie, prix, fiche technique… Le point sur les toutes les rumeurs et les informations confirmées

Dans un marché tendu, Samsung renouvelle sa gamme premium avec les Galaxy S26, S26+ et S26 Ultra. Ces modèles valent-ils le coup ? Design, performances, autonomie, photo, on fait le…

Comment les VPN évoluent pour offrir une protection renforcée contre les menaces en ligne

Ces dernières années, les VPN ont évolué bien au-delà de leurs fonctionnalités d’origine, face aux nombreux défis liés à la sécurité en ligne. Comment deviennent-ils des alliés de poids pour…

Protocole WireGuard : fonctionnement, avantages et VPN compatibles

WireGuard est un protocole VPN moderne reconnu pour sa rapidité, sa stabilité et sa légèreté. Il est aujourd’hui largement adopté par les VPN pour améliorer les performances des connexions sécurisées….

Pragmata : prix, date de sortie, scénario… Tout ce qu’il faut retenir en 5 minutes du jeu de Capcom

Pragmata fait partie des titres les plus attendus de 2026, et témoigne de la bonne forme actuelle de son éditeur Capcom. Prévu pour sortir deux mois après Resident Evil Requiem,…

Bon plan TV S95F : Samsung propose une grosse remise sur sa meilleure TV OLED

Samsung baisse fortement le prix de la TV OLED la plus avancée du moment. Le modèle S95F sorti l’année dernière est en promotion dans ses versions de 55 pouces et…

Discord a menti : les selfies vidéo pour vérifier son âge seront traités par un tiers

Discord a annoncé qu’un système de vérification de l’âge va être déployé sur la plateforme. Pour rassurer les utilisateurs, on nous promettait que les selfies vidéo nécessaires pour prouver sa…

Samsung prépare une nouveauté bien utile pour sa mise à jour One UI 9

Now Nudge pourrait bien devenir l’une des fonctions IA les plus populaires sur les smartphones Samsung. Elle ne sera pas prête pour One UI 8.5, mais devrait l’être pour One…

L’émulateur 3DS progresse, Nvidia prépare une nouvelle Shield TV, le récap’ de la semaine

Un émulateur 3DS plus performant, une nouvelle Shield TV compatible HDR10+, le VPN des Pixel évolue, c’est le récap’ de la semaine. Alors qu’un des émulateurs Nintendo 3DS les plus…

Galaxy S26 : Samsung promet des photos de nuit de toute beauté

Samsung compte sur l’IA pour que les Galaxy S26 capturent de belles photos lumineuses en toutes circonstances, même de nuit.  Après des mois de rumeurs, Samsung a enfin officialisé la…

Le Ninja CRISPi chute à moins de 90 € et atteint son prix le plus bas : c’est le moment ou jamais de craquer !

Le Ninja CRISPi est un airfryer innovant qui vous permet de chauffer vos plats directement dans des contenants en verre que vous pouvez ensuite utiliser pour stocker les restes. Il…