Meta présente Voicebox, une IA capable de reproduire n’importe quel voix humaine

Meta vient de présenter officiellement Voicebox, une intelligence artificielle spécialisée dans la synthèse vocale. Ce modèle est capable de convertir du texte en fichier audio et générer des discours en basant avec ces échantillons de seulement deux secondes. 

meta voicebox
Crédits : 123RF

Comme vous le savez, les principaux acteurs de la Tech se sont lancées dans la course à l'IA. Après le lancement de ChatGPT en fin d'année 2022 et les 10 milliards de Microsoft investis dans la startup OpenAI, les géants du web se sont hâtés pour présenter à leur tour leur propre intelligence artificielle.

Google s'est illustré avec Bard, son IA conversationnelle, tandis que Meta a confirmé le développement de son IA dès avril 2023. Durant les derniers mois, la firme de Menlo Park a publié une multitude de modèles d'IA, à commencer par LLaMA (Large Language Model Meta AI), un modèle de langage open-source.

Il y a un peu, l'entreprise californienne a également dévoilé JEPA, un modèle qui a pour ambition de reproduire la pensée humaine, notamment en analysant et en comprenant des notions et concepts abstraits. Dans un tout autre domaine, Meta a également présenté MusicGen, une IA capable de créer une musique via une description textuelle basique.

meta voicebox
Crédits : Meta

Meta dévoile Voicebox, l'IA capable d'imiter la voix humaine

Or, ce 16 juin 2023, Meta a annoncé “sa nouvelle percée dans le domaine de l'IA générative pour la parole”. Cette IA, c'est Voicebox. Pour résumer, ce modèle d'IA de pointe est spécialisée dans la synthèse vocale. En d'autres termes, elle est capable de créer, modifier ou styliser des fichiers audio.

Abordons tout d'abord la fonctionnalité la plus intéressante (et probablement la plus problématique) de Voicebox : la synthèse texte-parole en contexte. En s'appuyant sur un extrait audio de deux secondes seulement, Voicebox est capable de générer un discours en simulant la voix et le phrasé de la personne entendue dans l'extrait.

De cette manière, Voicebox pourra simuler la voix d'un proche, d'un chanteur ou d'un homme politique. A l'avenir, Meta déclare que Voicebox et d'autres modèles d'IA générative similaires pourront donner des voix naturelles aux assistants vocaux ou aux PNJ dans le métaverse. En outre, ils pourraient également permettre aux malvoyants d'entendre des messages écrits avec les voix de leurs amis.

meta voicebox
Crédits : Meta

A lire également : Après Dall-E et Midjourney, cette nouvelle IA permet de générer une vidéo à partir d’un texte

Edition de fichiers audio et traduction instantanée

Mais ce n'est pas tout puisque Voicebox propose d'autres fonctionnalités :

  • L'édition de l'audio et la réduction de bruit : Voicebox peut recréer une portion de discours interrompue par du bruit ou remplacer des mots écorchés et mal prononcés sans avoir à enregistrer un nouveau un discours dans son intégralité (une sorte de gomme magique à la Google pour l'audio)
  • Traduction multilingue : Voicebox prend en charge six langues pour l'instant (anglais, français, espagnol, allemand, polonais et portugais), ce qui lui permet de transposer un discours dans une autre langue que celle du fichier original (tout en transposant le style et les nuances)

Pour réaliser ses différentes tâches, l'IA de Meta s'est perfectionnée sur plus de 50 000 heures d'extraits audio issus majoritairement de livres audio et de contenus libre de droits. Pour l'instant, Voicebox reste inaccessible au grand public, dans un souci de sécurité. Sans surprise, Meta redoute que son IA soit utilisée à mauvais escient, notamment pour imiter la voix de personnes réelles.

Source : Meta


Réagissez à cet article !

Demandez nos derniers articles !

La station d’énergie portable Allpowers R600 est à moitié prix : 149 € au lieu de 319 €

La station d’énergie portable Allpowers R600, dotée d’une batterie de 299 Wh et d’une puissance de 600 W, voit son prix chuter de plus de 50%. Pour ceux qui recherchent…

WWDC 2026 : à quelle heure et comment suivre la keynote Apple

Apple va tenir sa traditionnelle WWDC, keynote lors de laquelle l’entreprise nous présentera toutes les nouveautés logicielles à venir sur ses produits, à commencer par l’iPhone. La WWDC (Worldwide Developers…

Ninja Foodi FLEX 7-en-1 : avec 90 € de remise, le airfryer est de retour à prix cassé !

Le Ninja Foodi FLEX 7-en-1 a spécialement été conçu pour préparer des repas pour toute la famille. Avec sa capacité de 10,4 litres, vous pouvez cuisiner pour 8 personnes !…

Anthony Stewart Head, acteur star de Buffy contre les vampires, est mort

Il incarnait le professeur Rupert Giles dans la série culte Buffy contre les vampires, Anthony Stewart Head est décédé à l’âge de 72 ans. On l’avait vu à l’écran ces…

Pourquoi Google ferme cette application Android qui permet de générer des images par IA

L’application Pixel Studio vit ses derniers moments. La dernière mise à jour déployée par Google la rend inopérable, confirmant la fin de son support. Mais pour quelle raison ferme-t-elle ?…

Le Samsung Galaxy A27 se dévoile (encore), mais dans un nouveau coloris « ultra-frais »

Alors que l’on pensait déjà (presque) tout connaître au sujet du Samsung Galaxy A27, une nouvelle fuite est venue nous cueillir. Le futur smartphone milieu de gamme ne serait finalement…

Google Maps : oubliez le stress des trajets grâce à cette fonctionnalité méconnue

Que ce soit lors des trajets du quotidien ou vers des destinations inédites, surveiller constamment Google Maps du coin de l’oeil peut être stressant au volant. Heureusement, l’appli GPS a…

Xiaomi va intégrer un grand écran secondaire au dos de ce nouveau smartphone

Le Xiaomi 18 Pro pourrait intégrer un grand écran d’une taille de 4 pouces à l’arrière. Cet affichage secondaire serait encore plus ambitieux que sur le Xiaomi 17 Pro. L’année…

“Quand c’est trop, c’est trop” : Google et Opera s’adressent directement à Satya Nadella pour se plaindre d’Edge

Dans une lettre ouverte, la Browser Choice Alliance demande publiquement à Satya Nadella d’en finir avec les pratiques anticoncurrentielles d’Edge. Sont mis en cause les traditionnels griefs contre le navigateur,…

« La découverte a été fortuite » : Euclid révèle le secret du vieil amas stellaire NGC 6397

L’on confie aux instruments spatiaux des missions principales, mais les données qu’ils recueillent font parfois avancer la recherche là où ne l’attendait pas. C’est le cas d’Euclid, le télescope spatial…