Voici Emo, le premier robot capable de synchroniser ses lèvres comme nous : son mode d’apprentissage est fou

Si certaines entreprises de robotique ne s’embarrassent pas avec le réalisme, d’autres projets se focalisent sur cet aspect. Simplement en observant des vidéos YouTube, un robot conçu par les ingénieurs de Columbia Engineering est désormais capable de synchroniser ses lèvres comme les humains. La preuve (déroutante) en vidéo.

Emo robot synchronisation lèvres
Crédits : John Abbott / Columbia Engineering

La robotique. Vaste sujet, tantôt fascinant, tantôt effrayant, et parfois même les deux (mon capitaine). Si certains chercheurs s’échinent à concevoir des machines capables de s’adapter à n’importe quelle situation – même quand on leur tranche les « pattes » avec une tronçonneuse – d’autres équipes s’affairent davantage autour de l’aspect humanoïde.

Les mains d’Allex sont, par exemple capables de reproduire la finesse des mouvements des nôtres. Aujourd’hui, un nouveau nom s’ajoute à cette liste de robots aux traits réalistes : Emo.

Ce robot a appris à synchroniser ses lèvres comme un humain en regardant des vidéos YouTube

Comme Only Head, Emo n’a pas un corps humanoïde : son visage est extrêmement réaliste – même s’il l’est un peu moins. Mais ce n’est pas cet aspect qui fait l’intérêt et la singularité de ce robot conçu par des chercheurs de Columbia Engineering : Emo est le premier robot capable de synchroniser ses lèvres avec la parole et le chant comme un humain.

Pour acquérir cette compétence (dont les résultats sont visibles dans la vidéo ci-dessous), les ingénieurs ont privilégié un apprentissage observationnel en plusieurs étapes. D’abord, Emo s’est approprié son visage en silicone en faisant bouger ses 26 moteurs indépendants, tout en s’observant dans un miroir. Il a ainsi pu apprendre l'influence des commandes motrices sur les formes du visage, ses lèvres, sa mâchoire et ses joues étant mobiles.

Puis, Emo a étudié des heures de vidéos YouTube : une IA lui a permis d’établir les liens entre audio et mouvements. Ce n’est pas le sens des mots qui importait ici, mais les sons bruts. Ces relations conceptualisées ont par la suite été converties en commandes motrices en temps réel. En se focalisant sur l’aspect technique, Emo a appris à articuler naturellement dans plusieurs langues : anglais, arabe, chinois, mais aussi français.

Ses moteurs, capables de reproduire des mouvements de bouche avec précision, lui permettent de couvrir 24 consonnes et 16 voyelles : une condition indispensable pour chanter. Ce qu’Emo sait faire avec une chanson de son premier album généré par IA : « hello world_ ».

Selon Digital Trends, ce réalisme poussé vise à réduire l’effet « vallée de l’étrange » (ou Uncanny Valley), une théorie selon laquelle, quand un objet atteint un certain degré d’anthropomorphisme, il provoque une sensation de malaise. Les chercheurs estimeraient que, pour travailler aux côtés des humains, les robots devront savoir communiquer « naturellement ». Mais un robot avec des expressions faciales plus « humaines » ne renforce-t-il pas cette gêne par le simple fait que l’on sache que c’est un robot ?


Réagissez à cet article !

Demandez nos derniers articles !

The Mandalorian & Grogu : date de sortie, histoire, casting, tout ce qu’il faut savoir sur le retour de Star Wars au cinéma

Le duo le plus célèbre de la galaxie s’apprête à franchir une nouvelle étape. Après trois saisons à succès sur petit écran, Din Djarin et son apprenti Grogu font le…

Des fuites chez Samsung, un logiciel Windows piégé par un malware, c’est le récap’ de la semaine

Samsung dévoile malgré lui ses futurs smartphones pliables, un malware menace les PC Windows, Xiaomi propose de booster vos anciens téléphones, c’est le récap’ de la semaine. Cette semaine, le…

Test Honor 600 Pro : un smartphone équilibré et vraiment convaincant

Après le Honor 600, c’est au tour de sa version « Pro » de passer à la moulinette de nos tests. Plus cher et, surtout, plus ambitieux, le Honor 600 Pro reprend…

L’iPhone 18 Pro aurait une nouvelle technologie d’écran, pour quels bénéfices ?

Apple intégrerait pour la première fois des écrans de technologie LTPO+ pour ses iPhone 18 Pro, plus performants que les affichages LTPO traditionnels. Les iPhone 18 Pro et 18 Pro…

L’aide à la rédaction par IA de Gmail s’améliore, voici ce qui change

L’outil d’aide à la rédaction par IA de Gmail devient plus pertinent en prenant désormais en compte le contexte personnel de l’utilisateur. Des options de personnalisation du ton et du…

Instagram supprime le chiffrement de bout en bout, vos messages privés ne sont plus protégés

La sécurité de vos messages privés sur Instagram a pris un coup. Le réseau social vient d’annoncer la fin de la prise en charge du chiffrement de bout en bout,…

Les consoles portables sous Windows vont gagner en autonomie grâce à cette initiative de Xbox

Le projet Green Leaf de Xbox vise à réduire la consommation d’énergie des jeux afin d’améliorer l’autonomie des consoles portables tournant sous Windows. Xbox est au four et au moulin…

Le air fryer Ninja DualZone XL passe à petit prix en cumulant ces 2 offres, c’est le moment d’en profiter !

Vous cherchez un airfryer polyvalent pour cuisiner pour toute la famille ? La friteuse sans huile Ninja DualZone XL profite d’une grande capacité de 7,6 L divisée en deux zones….

Avec Android 17, l’écran d’accueil va enfin devenir plus personnalisable pour les Pixel

Google pourrait enfin laisser les utilisateurs supprimer la fameuse barre de recherche de l’écran d’accueil des Pixel dans une prochaine version d’Android 17. Le widget de barre de recherche Google…

Une fonctionnalité discrète mais très appréciée de Google Photos disparaît cet été. Elle concerne les utilisateurs qui sauvegardent leurs photos depuis un ordinateur. Google a déjà fixé les dates, et…

PC