La nouvelle IA d’Apple peut modifier des images à partir de phrases en langage naturel

MGIE, le modèle d'IA introduit par Apple, promet de transformer l'édition d'images en interprétant des instructions textuelles, marquant une avancée majeure dans le domaine créatif assisté par intelligence artificielle pour l’entreprise.

ia photos apple
Source : arxiv

L'évolution de l'IA dans le domaine de la création d'images a franchi des étapes significatives, notamment avec Bing Image Creator de Microsoft, offrant aux utilisateurs la possibilité de générer des images à partir de descriptions textuelles. Cette innovation, ainsi que les améliorations ultérieures en termes de vitesse et d'efficacité, témoignent de l'avancement rapide de l'entreprise dans l'utilisation de l'intelligence artificielle pour des applications créatives.

Microsoft a récemment dépassé Apple en termes de valorisation, principalement grâce à son engagement et à ses avancées significatives dans le domaine de l'intelligence artificielle, comme en témoignent les succès de ChatGPT-4 et Copilot Pro. Dans ce contexte, MGIE d'Apple apparaît comme une réponse stratégique visant à maintenir sa compétitivité dans le domaine de l'IA.

Apple présente un nouveau modèle d'édition d'images par IA

Fruit d'une collaboration entre Apple et des chercheurs de l'Université de Californie à Santa Barbara., MGIE (MLLM-Guided Image Editing) se distingue par sa capacité à comprendre et exécuter des commandes textuelles pour des manipulations précises au niveau des pixels. Cette capacité à transformer des instructions textuelles simples ou ambiguës en directives claires et précises ouvre de nouvelles possibilités pour l'édition d'images intuitives. Présenté lors de la conférence ICLR 2024, ce modèle démontre une efficacité remarquable. Il offre des résultats précis qui ont été approuvés par les utilisateurs, tout en fonctionnant rapidement et sans gaspiller de ressources.

MGIE se distingue par sa capacité à réaliser une large gamme de modifications d'images, allant de simples ajustements de couleurs à des transformations complexes d'objets. Le modèle optimise également les photos de manière globale et permet des retouches ciblées sur des zones spécifiques. Il excelle dans le recadrage, le redimensionnement, la rotation des images, ainsi que l'ajustement de la luminosité, du contraste et de la balance des couleurs, le tout à partir de simples prompts textuels. Disponible en open source, ce programme est facile d'accès via GitHub, avec des ressources supplémentaires comme un notebook de démonstration et une démo web sur Hugging Face Spaces, rendant son utilisation pratique pour diverses applications d'édition.

Source : arxiv


Réagissez à cet article !

Demandez nos derniers articles !

L’interface du Galaxy Z Fold Wide a fuité, il veut vraiment se mesurer à l’iPhone pliable

Des images de l’interface du Galaxy Z Fold Wide, nouveau smartphone pliable de Samsung, confirment son format d’écran, qui semble proche de celui de l’iPhone pliable à venir. L’arrivée sur…

Pas d’inquiétude : la PS6 sera moins chère et plus puissante que la PS5 Pro

Les hausses de prix continues de la PS5 font craindre une PS6 vendue à un tarif démesuré ou à la fiche technique revue à la baisse. Mais Sony devrait réussir…

Netflix condamné pour des hausses de prix illégales, la plateforme doit rembourser ses abonnés

Un tribunal italien a validé le caractère abusif des clauses des contrats Netflix, autorisant la modification du prix des abonnements sans raison valable. Cette décision pourrait avoir des répercussions en…

Jusqu’à 130 € de remise sur la Galaxy Watch 8 Classic : la montre haut de gamme de Samsung est à prix cassé !

Normalement en vente à 530 €, la Galaxy Watch 8 Classic est actuellement beaucoup plus abordable sur le site officiel de Samsung. Grâce à une réduction de 80 € avec…

Propriétaire d’un Google Pixel ? Désactivez ces fonctionnalités inutiles pour gagner en autonomie

Les Google Pixel proposent de nombreuses fonctionnalités exclusives. Et si certaines se révèlent utiles au quotidien, d’autres font clairement office d’accessoire… En plus d’impacter l’autonomie de votre appareil. Alors, autant…

Plus d’équipements et presque le même prix, cette série spéciale Citroën va faire des jaloux

Citroën vient de lancer une nouvelle série spéciale baptisée Collection sur ses trois modèles électriques. Les ë-C3, ë-C3 Aircross et ë-C4 gagnent en équipements et en style. La surprise vient…

Un benchmark du Galaxy S26 FE nous donne une idée précise de ses performances

Il y aura bien un Galaxy S26 FE cette année. Les performances du smartphone ont été mesurées sur Geekbench, nous donnant un aperçu de ce qu’il a dans le ventre….

“Le forfait mobile de la démesure” : l’UFC-Que Choisir sceptique face à la nouvelle offre Free Max

Le nouveau forfait mobile Free Max a beaucoup fait parler de lui en bien en promettant de la 5G en illimité dans de nombreux pays. Mais une telle offre ne…

Artemis II va diffuser des images de la Lune en 4K grâce à une technologie laser inédite

La mission Artemis II embarque une technologie de communication révolutionnaire. Des faisceaux laser permettront de diffuser de la vidéo 4K depuis l’orbite lunaire. C’est une première absolue dans l’histoire de…

La mise à jour iOS 26.5 arrive bientôt sur votre iPhone, mais à quelle date ?

Apple a déjà bien avancé sur le développement de la mise à jour iOS 26.5, voici quand vous pouvez espérer recevoir cette version sur votre iPhone. Apple a lancé la…