Cette IA fait parler des photos de manière très réaliste, le résultat est stupéfiant

Microsoft dévoile une intelligence artificielle capable d'animer des photos et de les faire parler de façon ultraréaliste. C'est saisissant, même si on peut quand même repérer quelques bizarreries.

Portraits
Crédits : 123RF

On a beau dire que l'intelligence artificielle pourra bientôt remplacer les humains, elle a encore du chemin à parcourir sur un point : recréer les expressions humaines sans tomber dans la vallée de l'étrange. Ce concept disant que plus une machine ressemble à un humain, plus ses défauts nous dérangent. Ça n'empêche pas la création de deepfakes parfois suffisamment réalistes pour arnaquer un employé lors d'une fausse visioconférence.

Les avancées dans ce domaine sont pourtant bien là. On pense aux présentateurs de JT entièrement artificiels, mais presque impossible à distinguer d'un vrai journaliste par exemple. Une équipe de Microsoft va plus loin puisqu'elle dévoile VASA-1, une IA capable d'animer des photos de visages et de les faire parler de manière ultraréaliste. Sur les nombreuses vidéos disponibles en exemple, on note en effet une synchronisation labiale parfaite et des expressions faciales bluffantes. Même les inspirations sont reproduites à la perfection.

Une nouvelle IA de Microsoft anime des portraits et les fait parler

Au final, ce sont surtout les mouvements de tête qui trahissent le côté artificiel de la chose. Ils donnent l'impression que la caméra utilise un stabilisateur d'images et que les personnes sont en réalité en train de bouger rapidement. Cela se voit encore plus si le sujet a les cheveux longs. Certaines émotions comme la joie ne sont pas tout à fait au point également. On dirait plus que l'homme vient de consommer une substance illicite qui l'a détendu.

Pour le reste, c'est impressionnant. VASA fonctionne aussi avec des langues étrangères et peut animer des illustrations ou des peintures. Vous pouvez voir la Joconde se lancer dans un rap, ça vaut le détour.

Lire aussi – Ce robot prédit quand vous allez sourire et sourit avant vous, c’est terrifiant

Les équipes restent conscientes que leur outil pourrait être détourné. “Il n’est pas destiné à créer du contenu utilisé pour induire en erreur ou tromper. Cependant, comme d’autres techniques de génération de contenu similaires, elle pourrait être utilisée à mauvais escient pour usurper l’identité d’êtres humains“.

Pour cette raison, les chercheurs préviennent qu'ils n'ont “pas l'intention de publier une démo en ligne, une API, un produit, des détails de mise en œuvre supplémentaires ou toute offre connexe tant [qu'ils] ne [sont] pas certains que la technologie sera utilisée de manière responsable et conformément aux réglementations appropriées“.


Réagissez à cet article !

Demandez nos derniers articles !

Bon plan Redmi Note 15 Pro Plus : le smartphone de Xiaomi passe à prix mini avec cette offre à durée limitée !

Snapdragon 7s Gen 4, batterie 6500 mAh, caméra 200 MP, écran AMOLED de 6,83 pouces 1,5K, le Redmi Note 15 Pro Plus ne manque pas d’atouts ! Sorti en début…

À seulement 65 €, la tablette Honor Pad X8a offre bien plus que ce que son prix laisse penser

La Honor Pad X8a est une tablette idéale pour les petits budgets. Son prix vient de passer sous la barre des 70 € grâce à deux réductions cumulables chez AliExpress….

Le codec AV2 est finalisé, il promet une meilleure qualité vidéo en streaming

Les caractéristiques du codec AV2 ont été finalisées. Celui-ci est plus efficace que l’AV1, permettant d’améliorer la qualité vidéo en streaming, qui souffre encore de la comparaison avec les supports…

Prise en main de l’Asus ROG Xbox Ally X20 : voici pourquoi la nouvelle console à écran OLED 7,4″ a tout pour plaire

Une nouvelle ROG Xbox Ally, qui l’eût cru ? Pourtant, Republic of Gamers profite de ses 20 ans pour mettre à jour sa dernière console portable, et pas qu’à moitié…

Windows 11 : le nouveau menu Démarrer vous agace ? Ce logiciel offre une alternative bien plus efficace

En 5 ans seulement, le menu Démarrer de Windows 11 a subit de nombreuses modifications. Reste que le résultat final n’est pas à la hauteur pour beaucoup d’utilisateurs. Alors, si…

L’excellent Honor 400 5G avec son capteur 200 MP chute à 189,90 € seulement, c’est du jamais vu et ça ne va pas durer !

Vous cherchez un smartphone pas cher, mais avec des caractéristiques avancées ? Le Honor 400 est affiché à 239,90 € seulement sur AliExpress. C’est déjà un super prix pour un…

Nvidia annonce le DLSS 4.5 Ray Reconstruction, compatible avec les anciennes cartes graphiques

Le DLSS 4.5 Ray Reconstruction est la dernière technologie qui va débarquer sur nos cartes graphiques Nvidia. Elle vise à améliorer les performances en ray tracing et path tracing. Nvidia…

La DJI Osmo Pocket 3 à moitié prix : ce code fracasse le prix de la caméra, mais les stocks risquent de fondre rapidement

Vous cherchez une petite caméra stabilisée pour vous accompagner en voyage ? La parfaiteOsmo Pocket 3 de DJI est idéale pour tourner des VLOGs. Très simple d’utilisation et stabilisée, elle…

Le partage de compte en danger : Netflix, Disney et Apple remportent une victoire contre Spliiit

La justice française a donné raison à Netflix, Disney et Apple, condamnant la plateforme de partage d’abonnement Spliiit, qui est de plus en plus sous pression. Il y a quelques…

Quelle est la vitesse d’expansion de l’Univers ? La découverte de cette « ancienne civilisation » cosmique serait la clé de cette énigme

Les trous noirs sont auréolés de mystère, notamment en ce qui concerne leur fusion. Mais un changement de paradigme fondé sur les ondes gravitationnelles vient bouleverser notre compréhension et pourrait…