Meta présente Voicebox, une IA capable de reproduire n’importe quel voix humaine

Meta vient de présenter officiellement Voicebox, une intelligence artificielle spécialisée dans la synthèse vocale. Ce modèle est capable de convertir du texte en fichier audio et générer des discours en basant avec ces échantillons de seulement deux secondes. 

meta voicebox
Crédits : 123RF

Comme vous le savez, les principaux acteurs de la Tech se sont lancées dans la course à l'IA. Après le lancement de ChatGPT en fin d'année 2022 et les 10 milliards de Microsoft investis dans la startup OpenAI, les géants du web se sont hâtés pour présenter à leur tour leur propre intelligence artificielle.

Google s'est illustré avec Bard, son IA conversationnelle, tandis que Meta a confirmé le développement de son IA dès avril 2023. Durant les derniers mois, la firme de Menlo Park a publié une multitude de modèles d'IA, à commencer par LLaMA (Large Language Model Meta AI), un modèle de langage open-source.

Il y a un peu, l'entreprise californienne a également dévoilé JEPA, un modèle qui a pour ambition de reproduire la pensée humaine, notamment en analysant et en comprenant des notions et concepts abstraits. Dans un tout autre domaine, Meta a également présenté MusicGen, une IA capable de créer une musique via une description textuelle basique.

meta voicebox
Crédits : Meta

Meta dévoile Voicebox, l'IA capable d'imiter la voix humaine

Or, ce 16 juin 2023, Meta a annoncé “sa nouvelle percée dans le domaine de l'IA générative pour la parole”. Cette IA, c'est Voicebox. Pour résumer, ce modèle d'IA de pointe est spécialisée dans la synthèse vocale. En d'autres termes, elle est capable de créer, modifier ou styliser des fichiers audio.

Abordons tout d'abord la fonctionnalité la plus intéressante (et probablement la plus problématique) de Voicebox : la synthèse texte-parole en contexte. En s'appuyant sur un extrait audio de deux secondes seulement, Voicebox est capable de générer un discours en simulant la voix et le phrasé de la personne entendue dans l'extrait.

De cette manière, Voicebox pourra simuler la voix d'un proche, d'un chanteur ou d'un homme politique. A l'avenir, Meta déclare que Voicebox et d'autres modèles d'IA générative similaires pourront donner des voix naturelles aux assistants vocaux ou aux PNJ dans le métaverse. En outre, ils pourraient également permettre aux malvoyants d'entendre des messages écrits avec les voix de leurs amis.

meta voicebox
Crédits : Meta

A lire également : Après Dall-E et Midjourney, cette nouvelle IA permet de générer une vidéo à partir d’un texte

Edition de fichiers audio et traduction instantanée

Mais ce n'est pas tout puisque Voicebox propose d'autres fonctionnalités :

  • L'édition de l'audio et la réduction de bruit : Voicebox peut recréer une portion de discours interrompue par du bruit ou remplacer des mots écorchés et mal prononcés sans avoir à enregistrer un nouveau un discours dans son intégralité (une sorte de gomme magique à la Google pour l'audio)
  • Traduction multilingue : Voicebox prend en charge six langues pour l'instant (anglais, français, espagnol, allemand, polonais et portugais), ce qui lui permet de transposer un discours dans une autre langue que celle du fichier original (tout en transposant le style et les nuances)

Pour réaliser ses différentes tâches, l'IA de Meta s'est perfectionnée sur plus de 50 000 heures d'extraits audio issus majoritairement de livres audio et de contenus libre de droits. Pour l'instant, Voicebox reste inaccessible au grand public, dans un souci de sécurité. Sans surprise, Meta redoute que son IA soit utilisée à mauvais escient, notamment pour imiter la voix de personnes réelles.

Source : Meta


Réagissez à cet article !

Demandez nos derniers articles !

Apple Watch : santé, nouveau geste et IA, tout ce qui change avec watchOS 27

Apple vient de présenter toutes ses futures nouveautés logicielles lors de sa Worldwide Developers Conference du 8 juin. Si Siri AI, Apple Intelligence et iOS 27 étaient les têtes d’affiche…

Cette enquête dévoile l’ampleur réelle de la campagne menée par ces pirates très organisés

Une nouvelle enquête lève le voile sur un groupe de pirates particulièrement audacieux. Ses membres se font passer pour des techniciens informatiques afin de voler des fichiers sensibles. Le bilan…

Supergirl : Kara Zor-El rencontre Superman et se bagarre dans ces deux extraits inédits

La rencontre avec Superman puis une bonne vielle bagarre dans un bar. Warner nous offre deux extraits du film Supergirl avant sa sortie en salle histoire de nous mettre l’eau…

Xbox Series X25 : Microsoft veut faire barrage aux scalpers, mais est-ce vraiment possible ?

Sur X (anciennement Twitter), le directeur marketing de Xbox a promis que Microsoft met tout en œuvre pour éviter que les scalpers ne s’accaparent les rares exemplaires de la Xbox…

Windows 11 corrige l’une de ses lenteurs les plus agaçantes

Windows 11 traîne une réputation de lenteur depuis plusieurs années. Microsoft promet enfin d’accélérer une tâche aussi banale qu’agaçante quand elle s’éternise, et ce n’est qu’un début. Windows 11 accumule…

iOS 27 : Apple Intelligence et Siri AI arrivent enfin, mais qui pourra en profiter ?

Lors de l’édition 2026 de sa Worldwide Developers Conference, Apple a dévoilé les deux nouveautés majeures qui lui permettront de véritablement entrer dans l’ère de l’IA lorsqu’elles seront disponibles : une…

One UI 9 : ce nouveau geste va permettre d’invoquer Bixby sur votre smartphone Samsung

Avec la mise à jour vers One UI 9, Samsung ajoute un nouveau geste pour invoquer rapidement Bixby sur son smartphone Galaxy. Alors que le déploiement de la mise à…

Avec iOS 27, Temps d’écran devient un contrôle parental moderne, merci Apple

À l’occasion de la WWDC, Apple présente la mise à jour de Temps d’écran, le système de contrôle parental d’iOS, iPadOS et MacOS. Cette nouvelle version mise sur l’évolutivité, la…

Apple dévoile enfin la révolution que l’on n’attendait plus : Siri est mort, vive Siri AI – ce qu’il faut savoir

La nouvelle version de Siri était l’une des nouveautés les plus attendues de la WWDC d’Apple. Avec ce nouvel assistant dopé à l’IA, la marque à la pomme croquée va…

Cette nouvelle fonction de l’iPhone va tout changer, enfin une annonce IA excitante

iOS 27 apporte de nombreuses fonctionnalités basées sur l’IA à l’iPhone. L’une d’entre elles a particulièrement retenu notre attention : la possibilité de créer facilement des Raccourcis personnalisés. Les Raccourcis…