La nouvelle IA d’Apple peut modifier des images à partir de phrases en langage naturel

MGIE, le modèle d'IA introduit par Apple, promet de transformer l'édition d'images en interprétant des instructions textuelles, marquant une avancée majeure dans le domaine créatif assisté par intelligence artificielle pour l’entreprise.

ia photos apple
Source : arxiv

L'évolution de l'IA dans le domaine de la création d'images a franchi des étapes significatives, notamment avec Bing Image Creator de Microsoft, offrant aux utilisateurs la possibilité de générer des images à partir de descriptions textuelles. Cette innovation, ainsi que les améliorations ultérieures en termes de vitesse et d'efficacité, témoignent de l'avancement rapide de l'entreprise dans l'utilisation de l'intelligence artificielle pour des applications créatives.

Microsoft a récemment dépassé Apple en termes de valorisation, principalement grâce à son engagement et à ses avancées significatives dans le domaine de l'intelligence artificielle, comme en témoignent les succès de ChatGPT-4 et Copilot Pro. Dans ce contexte, MGIE d'Apple apparaît comme une réponse stratégique visant à maintenir sa compétitivité dans le domaine de l'IA.

Apple présente un nouveau modèle d'édition d'images par IA

Fruit d'une collaboration entre Apple et des chercheurs de l'Université de Californie à Santa Barbara., MGIE (MLLM-Guided Image Editing) se distingue par sa capacité à comprendre et exécuter des commandes textuelles pour des manipulations précises au niveau des pixels. Cette capacité à transformer des instructions textuelles simples ou ambiguës en directives claires et précises ouvre de nouvelles possibilités pour l'édition d'images intuitives. Présenté lors de la conférence ICLR 2024, ce modèle démontre une efficacité remarquable. Il offre des résultats précis qui ont été approuvés par les utilisateurs, tout en fonctionnant rapidement et sans gaspiller de ressources.

MGIE se distingue par sa capacité à réaliser une large gamme de modifications d'images, allant de simples ajustements de couleurs à des transformations complexes d'objets. Le modèle optimise également les photos de manière globale et permet des retouches ciblées sur des zones spécifiques. Il excelle dans le recadrage, le redimensionnement, la rotation des images, ainsi que l'ajustement de la luminosité, du contraste et de la balance des couleurs, le tout à partir de simples prompts textuels. Disponible en open source, ce programme est facile d'accès via GitHub, avec des ressources supplémentaires comme un notebook de démonstration et une démo web sur Hugging Face Spaces, rendant son utilisation pratique pour diverses applications d'édition.

Source : arxiv


Réagissez à cet article !

Demandez nos derniers articles !

Samsung démocratise la maison connectée : 25 appareils IKEA désormais directement intégrés à SmartThings

Samsung a son propre système de domotique : SmartThings. Ces derniers temps, la firme sud-coréenne multiplie les efforts pour étendre ses capacités. Le dernier en date consiste à rendre la création…

Deezer : près de 50 % des titres mis en ligne chaque jour sont générés par l’IA

La plateforme de streaming audio Deezer dévoile un chiffre choc sur les musiques s’ajoutant chaque jour au catalogue. La présence de l’IA ne cesse d’augmenter au fil du temps. Plus…

IA

Des barrettes de RAM DDR5 2 fois moins performantes : la solution d’Asus contre la pénurie ?

Asus et HKEPC testent des barrettes de mémoire RAM en divisant leur bande passante par deux. Ce serait l’une des solutions envisagées pour pallier la pénurie de composants. La crise…

Cette Citroën électrique à moins de 13 000 € est une bonne affaire, sauf si vous lisez les petites lignes

Les voitures électriques abordables se font rares, mais Citroën vient de franchir un cap inédit. La ë-C3 Autonomie Urbaine descend à 12 990 € aides déduites, un record sur le…

WH-1000XX : Sony confirme par erreur le lancement d’un nouveau casque Bluetooth premium, mais attention à votre portefeuille

Une petite bourde de Sony a permis de confirmer une rumeur qui circule depuis des semaines : la sortie d’un nouveau casque Bluetooth premium. Celui-ci sera baptisé WH-1000XX et, malgré…

Google Photos ajoute 7 outils de retouches rapides pour vous rendre plus beau

Plus besoin d’envoyer votre photo à Gemini si elle ne nécessite que quelques retouches subtiles pour sublimer les visages. Google Photos regroupe désormais plusieurs outils dédiés accessibles très facilement. Retoucher…

Cet OS inédit de Hyundai redonne aux boutons physiques la place que les écrans leur avaient volée

Les écrans tactiles ont envahi les habitacles au point de faire disparaître les boutons physiques. Hyundai prend le contre-pied de cette tendance avec un nouvel OS maison qui les remet…

Clair Obscur : Expedition 33, le jeu culte chute à moins de 35 € sur PS5 et Xbox Series, vite !

S’il y a bien un jeu vidéo qui a marqué l’année 2025, c’est bien évidemment l’incroyable et inattendu Clair Obscur : Expedition 33. Ce jeu français, multi-récompensé, est aujourd’hui à…

Artemis II confirme ce que les scientifiques redoutaient sur le cerveau des astronautes

Flotter en apesanteur semble anodin, mais le cerveau des astronautes en garde les traces longtemps. Des chercheurs ont découvert que la force exercée pour saisir un objet reste mal calibrée…

Instagram : un bug étonnant fait complètement disparaître les couleurs du réseau social

Depuis quelques jours, des utilisateurs d’Instagram s’inquiètent de voir leurs photos transformées en noir et blanc après avoir été postées. Le réseau social a confirmé qu’il s’agit d’un bug, qui…