La nouvelle IA d’Apple peut modifier des images à partir de phrases en langage naturel

MGIE, le modèle d'IA introduit par Apple, promet de transformer l'édition d'images en interprétant des instructions textuelles, marquant une avancée majeure dans le domaine créatif assisté par intelligence artificielle pour l’entreprise.

ia photos apple
Source : arxiv

L'évolution de l'IA dans le domaine de la création d'images a franchi des étapes significatives, notamment avec Bing Image Creator de Microsoft, offrant aux utilisateurs la possibilité de générer des images à partir de descriptions textuelles. Cette innovation, ainsi que les améliorations ultérieures en termes de vitesse et d'efficacité, témoignent de l'avancement rapide de l'entreprise dans l'utilisation de l'intelligence artificielle pour des applications créatives.

Microsoft a récemment dépassé Apple en termes de valorisation, principalement grâce à son engagement et à ses avancées significatives dans le domaine de l'intelligence artificielle, comme en témoignent les succès de ChatGPT-4 et Copilot Pro. Dans ce contexte, MGIE d'Apple apparaît comme une réponse stratégique visant à maintenir sa compétitivité dans le domaine de l'IA.

Apple présente un nouveau modèle d'édition d'images par IA

Fruit d'une collaboration entre Apple et des chercheurs de l'Université de Californie à Santa Barbara., MGIE (MLLM-Guided Image Editing) se distingue par sa capacité à comprendre et exécuter des commandes textuelles pour des manipulations précises au niveau des pixels. Cette capacité à transformer des instructions textuelles simples ou ambiguës en directives claires et précises ouvre de nouvelles possibilités pour l'édition d'images intuitives. Présenté lors de la conférence ICLR 2024, ce modèle démontre une efficacité remarquable. Il offre des résultats précis qui ont été approuvés par les utilisateurs, tout en fonctionnant rapidement et sans gaspiller de ressources.

MGIE se distingue par sa capacité à réaliser une large gamme de modifications d'images, allant de simples ajustements de couleurs à des transformations complexes d'objets. Le modèle optimise également les photos de manière globale et permet des retouches ciblées sur des zones spécifiques. Il excelle dans le recadrage, le redimensionnement, la rotation des images, ainsi que l'ajustement de la luminosité, du contraste et de la balance des couleurs, le tout à partir de simples prompts textuels. Disponible en open source, ce programme est facile d'accès via GitHub, avec des ressources supplémentaires comme un notebook de démonstration et une démo web sur Hugging Face Spaces, rendant son utilisation pratique pour diverses applications d'édition.

Source : arxiv


Réagissez à cet article !

Demandez nos derniers articles !

Gemini Intelligence : Google prépare une IA ultra-gourmande, les anciens smartphones Android laissés de côté

La suite d’outils d’IA de Google, sobrement baptisée Gemini Intelligence, est sur le point de débarquer. Mais les appareils Android les moins récents n’en bénéficieront probablement pas. L’intelligence artificielle s’immisce…

IA

Windows 11 : un bug bloque complètement certains PC, Microsoft réagit dans l’urgence

Certains utilisateurs de Windows 11 se sont retrouvés dans l’incapacité d’accéder à leurs PC à cause d’un bug affectant BitLocker. Microsoft affirme avoir résolu ce problème sur Windows 11, mais…

PC

The Mandalorian and Grogu : les premières critiques viennent de tomber, le nouveau film Star Wars divise déjà

À l’inverse de la série The Mandalorian, le film The Mandalorian and Grogu est loin de faire l’unanimité au niveau des critiques. Le dernier film de la franchise Star Wars…

VPN : pourquoi le nouveau protocole Dausos pourrait bien révolutionner votre vie privée ?

Surfshark vient de lancer Dausos, le premier protocole VPN conçu spécifiquement pour les particuliers. Tunnel privé, chiffrement inédit, vitesse record : une première dans l’industrie. Quand vous activez un VPN,…

7 éléments à configurer sur son VPN avant de l’utiliser (sans prise de tête)

Avant d’utiliser un VPN, quelques réglages simples peuvent améliorer la sécurité, la stabilité et les performances de la connexion. Serveur, protocole, protections de sécurité ou gestion du trafic : voici…

Google Messages va enfin nous laisser personnaliser le fond d’écran des conversations

Google Messages va se doter d’un outil laissant l’utilisateur choisir des thèmes personnalisés pour ses conversations. L’interface des paramètres permettant d’adapter le comportement des réponses intelligentes va aussi être optimisée…

iPhone, Samsung, Pixel ou Honor, quels sont les smartphones les plus rapides à recharger ?

Lors d’un grand comparatif, 33 smartphones Android et iPhone ont été testés pour déterminer quels sont les modèles qui se rechargent le plus rapidement. Et les gagnants ne sont pas…

Vous rêviez d’un MMO Le Seigneur des Anneaux ? Le jeu d’Amazon est annulé

On le sentait venir, c’est désormais confirmé : Amazon a abandonné son projet de développer un MMO dans l’univers du Seigneur des Anneaux. Un autre jeu pourrait toutefois voir le…

ChatGPT victime d’un piratage, OpenAI appelle ses utilisateurs sur Mac à mettre à jour l’application

OpenAI a confirmé avoir été la cible d’une cyberattaque cette semaine, cherchant à récolter les données personnelles des utilisateurs. Au final, plus de peur que de mal, mais la firme…

IA

Ninja brade son four à pizza avec cette double promotion : à vous les pizzas faites maison !

Vous connaissez Ninja pour ses airfryers au rapport qualité-prix imbattable, mais saviez-vous que le géant américain propose aussi de quoi préparer de délicieuses pizzas ? Normalement en vente à 379,99…