La nouvelle IA d’Apple peut modifier des images à partir de phrases en langage naturel

MGIE, le modèle d'IA introduit par Apple, promet de transformer l'édition d'images en interprétant des instructions textuelles, marquant une avancée majeure dans le domaine créatif assisté par intelligence artificielle pour l’entreprise.

ia photos apple
Source : arxiv

L'évolution de l'IA dans le domaine de la création d'images a franchi des étapes significatives, notamment avec Bing Image Creator de Microsoft, offrant aux utilisateurs la possibilité de générer des images à partir de descriptions textuelles. Cette innovation, ainsi que les améliorations ultérieures en termes de vitesse et d'efficacité, témoignent de l'avancement rapide de l'entreprise dans l'utilisation de l'intelligence artificielle pour des applications créatives.

Microsoft a récemment dépassé Apple en termes de valorisation, principalement grâce à son engagement et à ses avancées significatives dans le domaine de l'intelligence artificielle, comme en témoignent les succès de ChatGPT-4 et Copilot Pro. Dans ce contexte, MGIE d'Apple apparaît comme une réponse stratégique visant à maintenir sa compétitivité dans le domaine de l'IA.

Apple présente un nouveau modèle d'édition d'images par IA

Fruit d'une collaboration entre Apple et des chercheurs de l'Université de Californie à Santa Barbara., MGIE (MLLM-Guided Image Editing) se distingue par sa capacité à comprendre et exécuter des commandes textuelles pour des manipulations précises au niveau des pixels. Cette capacité à transformer des instructions textuelles simples ou ambiguës en directives claires et précises ouvre de nouvelles possibilités pour l'édition d'images intuitives. Présenté lors de la conférence ICLR 2024, ce modèle démontre une efficacité remarquable. Il offre des résultats précis qui ont été approuvés par les utilisateurs, tout en fonctionnant rapidement et sans gaspiller de ressources.

MGIE se distingue par sa capacité à réaliser une large gamme de modifications d'images, allant de simples ajustements de couleurs à des transformations complexes d'objets. Le modèle optimise également les photos de manière globale et permet des retouches ciblées sur des zones spécifiques. Il excelle dans le recadrage, le redimensionnement, la rotation des images, ainsi que l'ajustement de la luminosité, du contraste et de la balance des couleurs, le tout à partir de simples prompts textuels. Disponible en open source, ce programme est facile d'accès via GitHub, avec des ressources supplémentaires comme un notebook de démonstration et une démo web sur Hugging Face Spaces, rendant son utilisation pratique pour diverses applications d'édition.

Source : arxiv


Réagissez à cet article !

Demandez nos derniers articles !

Friendslop : c’est LA grosse tendance du jeu vidéo de 2026, mais c’est quoi exactement ?

Il est probable que vous n’ayez jamais entendu le terme friendslop de votre vie et pourtant, ce nouveau genre du jeu vidéo fait actuellement un véritable carton. Mais de quoi…

Le forfait Navigo Annuel enfin disponible sur smartphone Android, et bientôt sur iPhone

Après une longue attente, il est enfin possible d’utiliser son smartphone Android pour valider son passe Navigo Annuel. Pour les propriétaires d’iPhone, il va falloir se montrer un peu plus…

Le terminal Linux d’Android s’offre enfin une interface digne de ce nom

Le mode Linux intégré à Android reste réservé aux plus curieux des utilisateurs. Son apparence austère n’aidait pas à le rendre attirant. La toute dernière bêta lui offre un lifting…

Microsoft Teams s’apprête à glisser dans vos réunions une IA qui vous observe en permanence

Microsoft continue de glisser son intelligence artificielle dans chaque logiciel professionnel. Sa dernière trouvaille pour Teams pousse pourtant le curseur un peu plus loin. Elle scrute désormais tout ce qui…

Non, cette loi ne veut pas faire exploser votre facture Internet (mais c’est tout de même une très mauvaise idée)

Panique sur les réseaux sociaux ce matin : le PS veut ajouter 10 centimes de plus sur notre facture Internet par gigaoctet téléchargé ! Vraiment ? En réalité, pas exactement….

Une flaque d’eau a suffi pour envoyer cette Tesla Model Y contre un rail avant qu’elle ne s’embrase

Une averse a transformé un trajet ordinaire en scène de chaos sur une autoroute chinoise. Le Tesla Model Y a violemment quitté sa trajectoire avant de s’embraser en quelques secondes….

Plasma Care UVC : la lampe UV qui tue bactéries et virus dans votre voiture pendant que vous conduisez

Hyundai et Kia dévoilent Plasma Care UVC, une technologie à base de lampes UV qui éliminent les bactéries présentes dans votre véhicule. Comment est-ce que ça fonctionne exactement ? Vous…

Cet objet cosmique pourrait résoudre l’énigme du trou noir qui gênait déjà Einstein

Les trous noirs restent parmi les objets les plus mystérieux de l’Univers. Une singularité en leur centre défie encore les lois de la physique. Des physiciens proposent aujourd’hui une piste…

Offres d’été Samsung : jusqu’à 200€ de réduction immédiate sur les Galaxy Z Flip7 et Z Flip7 FE

Samsung lance ses offres d’été jusqu’au 21 juillet, avec deux remises immédiates qui sortent du lot : 200€ sur le Galaxy Z Flip7 et 100€ sur le Z Flip7 FE,…

Gemini Spark débarque sur Mac pour le faire travailler à votre place

Ce n’était qu’une question de temps : Gemini Spark, l’IA agentique capable d’automatiser de nombreuses tâches sur vos appareils, arrive sur macOS. Et elle permet déjà pas mal de choses….