Cette IA fait parler des photos de manière très réaliste, le résultat est stupéfiant

Microsoft dévoile une intelligence artificielle capable d'animer des photos et de les faire parler de façon ultraréaliste. C'est saisissant, même si on peut quand même repérer quelques bizarreries.

Portraits
Crédits : 123RF

On a beau dire que l'intelligence artificielle pourra bientôt remplacer les humains, elle a encore du chemin à parcourir sur un point : recréer les expressions humaines sans tomber dans la vallée de l'étrange. Ce concept disant que plus une machine ressemble à un humain, plus ses défauts nous dérangent. Ça n'empêche pas la création de deepfakes parfois suffisamment réalistes pour arnaquer un employé lors d'une fausse visioconférence.

Les avancées dans ce domaine sont pourtant bien là. On pense aux présentateurs de JT entièrement artificiels, mais presque impossible à distinguer d'un vrai journaliste par exemple. Une équipe de Microsoft va plus loin puisqu'elle dévoile VASA-1, une IA capable d'animer des photos de visages et de les faire parler de manière ultraréaliste. Sur les nombreuses vidéos disponibles en exemple, on note en effet une synchronisation labiale parfaite et des expressions faciales bluffantes. Même les inspirations sont reproduites à la perfection.

Une nouvelle IA de Microsoft anime des portraits et les fait parler

Au final, ce sont surtout les mouvements de tête qui trahissent le côté artificiel de la chose. Ils donnent l'impression que la caméra utilise un stabilisateur d'images et que les personnes sont en réalité en train de bouger rapidement. Cela se voit encore plus si le sujet a les cheveux longs. Certaines émotions comme la joie ne sont pas tout à fait au point également. On dirait plus que l'homme vient de consommer une substance illicite qui l'a détendu.

Pour le reste, c'est impressionnant. VASA fonctionne aussi avec des langues étrangères et peut animer des illustrations ou des peintures. Vous pouvez voir la Joconde se lancer dans un rap, ça vaut le détour.

Lire aussi – Ce robot prédit quand vous allez sourire et sourit avant vous, c’est terrifiant

Les équipes restent conscientes que leur outil pourrait être détourné. “Il n’est pas destiné à créer du contenu utilisé pour induire en erreur ou tromper. Cependant, comme d’autres techniques de génération de contenu similaires, elle pourrait être utilisée à mauvais escient pour usurper l’identité d’êtres humains“.

Pour cette raison, les chercheurs préviennent qu'ils n'ont “pas l'intention de publier une démo en ligne, une API, un produit, des détails de mise en œuvre supplémentaires ou toute offre connexe tant [qu'ils] ne [sont] pas certains que la technologie sera utilisée de manière responsable et conformément aux réglementations appropriées“.


Abonnez-vous gratuitement à la newsletter

Chaque jour, le meilleur de Phonandroid dans votre boite mail !

Réagissez à cet article !

Demandez nos derniers articles !

Samsung Galaxy S26 : fenêtre de sortie, prix, fiche technique… Le point sur les toutes les rumeurs et les informations confirmées

Dans un marché tendu, Samsung renouvelle sa gamme premium avec les Galaxy S26, S26+ et S26 Ultra. Ces modèles valent-ils le coup ? Design, performances, autonomie, photo, on fait le…

Comment les VPN évoluent pour offrir une protection renforcée contre les menaces en ligne

Ces dernières années, les VPN ont évolué bien au-delà de leurs fonctionnalités d’origine, face aux nombreux défis liés à la sécurité en ligne. Comment deviennent-ils des alliés de poids pour…

Protocole WireGuard : fonctionnement, avantages et VPN compatibles

WireGuard est un protocole VPN moderne reconnu pour sa rapidité, sa stabilité et sa légèreté. Il est aujourd’hui largement adopté par les VPN pour améliorer les performances des connexions sécurisées….

Pragmata : prix, date de sortie, scénario… Tout ce qu’il faut retenir en 5 minutes du jeu de Capcom

Pragmata fait partie des titres les plus attendus de 2026, et témoigne de la bonne forme actuelle de son éditeur Capcom. Prévu pour sortir deux mois après Resident Evil Requiem,…

Bon plan TV S95F : Samsung propose une grosse remise sur sa meilleure TV OLED

Samsung baisse fortement le prix de la TV OLED la plus avancée du moment. Le modèle S95F sorti l’année dernière est en promotion dans ses versions de 55 pouces et…

Discord a menti : les selfies vidéo pour vérifier son âge seront traités par un tiers

Discord a annoncé qu’un système de vérification de l’âge va être déployé sur la plateforme. Pour rassurer les utilisateurs, on nous promettait que les selfies vidéo nécessaires pour prouver sa…

Samsung prépare une nouveauté bien utile pour sa mise à jour One UI 9

Now Nudge pourrait bien devenir l’une des fonctions IA les plus populaires sur les smartphones Samsung. Elle ne sera pas prête pour One UI 8.5, mais devrait l’être pour One…

L’émulateur 3DS progresse, Nvidia prépare une nouvelle Shield TV, le récap’ de la semaine

Un émulateur 3DS plus performant, une nouvelle Shield TV compatible HDR10+, le VPN des Pixel évolue, c’est le récap’ de la semaine. Alors qu’un des émulateurs Nintendo 3DS les plus…

Galaxy S26 : Samsung promet des photos de nuit de toute beauté

Samsung compte sur l’IA pour que les Galaxy S26 capturent de belles photos lumineuses en toutes circonstances, même de nuit.  Après des mois de rumeurs, Samsung a enfin officialisé la…

Le Ninja CRISPi chute à moins de 90 € et atteint son prix le plus bas : c’est le moment ou jamais de craquer !

Le Ninja CRISPi est un airfryer innovant qui vous permet de chauffer vos plats directement dans des contenants en verre que vous pouvez ensuite utiliser pour stocker les restes. Il…