La nouvelle IA d’Apple peut modifier des images à partir de phrases en langage naturel

MGIE, le modèle d'IA introduit par Apple, promet de transformer l'édition d'images en interprétant des instructions textuelles, marquant une avancée majeure dans le domaine créatif assisté par intelligence artificielle pour l’entreprise.

ia photos apple
Source : arxiv

L'évolution de l'IA dans le domaine de la création d'images a franchi des étapes significatives, notamment avec Bing Image Creator de Microsoft, offrant aux utilisateurs la possibilité de générer des images à partir de descriptions textuelles. Cette innovation, ainsi que les améliorations ultérieures en termes de vitesse et d'efficacité, témoignent de l'avancement rapide de l'entreprise dans l'utilisation de l'intelligence artificielle pour des applications créatives.

Microsoft a récemment dépassé Apple en termes de valorisation, principalement grâce à son engagement et à ses avancées significatives dans le domaine de l'intelligence artificielle, comme en témoignent les succès de ChatGPT-4 et Copilot Pro. Dans ce contexte, MGIE d'Apple apparaît comme une réponse stratégique visant à maintenir sa compétitivité dans le domaine de l'IA.

Apple présente un nouveau modèle d'édition d'images par IA

Fruit d'une collaboration entre Apple et des chercheurs de l'Université de Californie à Santa Barbara., MGIE (MLLM-Guided Image Editing) se distingue par sa capacité à comprendre et exécuter des commandes textuelles pour des manipulations précises au niveau des pixels. Cette capacité à transformer des instructions textuelles simples ou ambiguës en directives claires et précises ouvre de nouvelles possibilités pour l'édition d'images intuitives. Présenté lors de la conférence ICLR 2024, ce modèle démontre une efficacité remarquable. Il offre des résultats précis qui ont été approuvés par les utilisateurs, tout en fonctionnant rapidement et sans gaspiller de ressources.

MGIE se distingue par sa capacité à réaliser une large gamme de modifications d'images, allant de simples ajustements de couleurs à des transformations complexes d'objets. Le modèle optimise également les photos de manière globale et permet des retouches ciblées sur des zones spécifiques. Il excelle dans le recadrage, le redimensionnement, la rotation des images, ainsi que l'ajustement de la luminosité, du contraste et de la balance des couleurs, le tout à partir de simples prompts textuels. Disponible en open source, ce programme est facile d'accès via GitHub, avec des ressources supplémentaires comme un notebook de démonstration et une démo web sur Hugging Face Spaces, rendant son utilisation pratique pour diverses applications d'édition.

Source : arxiv


Réagissez à cet article !

Demandez nos derniers articles !

La dernière mise à jour de Windows 11 corrige un bug critique, installez-la maintenant

Microsoft déploie une mise à jour d’urgence, qui a pour but de corriger un bug important introduit par la mise à jour précédente. Le 26 mars dernier, Microsoft publiait la…

Performant et endurant, le POCO X8 Pro est déjà 35 % moins cher… pour une durée limitée

Le Poco X8 Pro vient à peine de sortir qu’il est déjà 35% moins cher. Grâce à une offre généreuse à durée limitée, ce smartphone performant et endurant passe sous…

Le port Lightning vous manque ? Ce bricoleur fou a créé une coque qui l’ajoute à l’iPhone 17 Pro

Ken Pillonel a encore frappé. Cette fois, l’ingénieur passionné de connectique Apple a ajouté un port Lightning à l’iPhone 17 Pro. En revanche, il a été un poil plus sage…

Le Honor 600 Lite arrive en France : une batterie XXL pour moins de 400 euros

Le Honor 600 Lite est disponible en France. Il se distingue par un capteur photo 108 MP, une batterie à très forte capacité et un design qui monte en gamme….

Fatigué de recevoir des appels téléphoniques avec personne au bout du fil ? On vous explique comment vous protéger de ces spams silencieux

Vous en avez marre de recevoir des spams téléphoniques silencieux ? On vous explique ce qui se cache derrière ces appels sans voix et surtout, comment se protéger efficacement. Si…

Les scientifiques sont formels : ne demandez pas conseil à l’IA après une dispute, elle est trop lèche-bot

Si vous souhaitez vous réconcilier avec un proche après une dispute, vous feriez mieux de ne pas demander conseil à ChatGPT (ou n’importe quel chatbot IA). C’est ce que vient…

IA

Les prix de la RAM DDR5 reculent enfin dans les magasins, mais ce n’est pas encore la fête

Les prix de la RAM DDR5 reculent enfin dans les magasins, et cette fois le mouvement dépasse l’Europe. Une analyse de marché confirme la tendance aux États-Unis et en Chine….

L’Union européenne veut bannir l’usage de l’IA pour ses communications officielles

Alors que les États-Unis ne se gênent plus pour utiliser l’IA générative pour leurs communications officielles, l’Union européenne se pose la question de bannir son usage. Dans notre ère de…

IA

La PS6 portable serait plus performante que la Switch 2 et la Xbox Series S

La future console portable de Sony disposerait de meilleures performances qu’une console de salon actuelle, la Xbox Series S. Sans surprise, elle sera aussi bien supérieure à la Switch 2….

Saturne cache une anomalie magnétique surprenante, et sa lune Encelade en serait la coupable

Saturne cache une anomalie magnétique que les scientifiques peinent à expliquer depuis des années. Six ans de données de la sonde Cassini viennent enfin d’en révéler la cause. Et la…