Meta présente Voicebox, une IA capable de reproduire n’importe quel voix humaine

Meta vient de présenter officiellement Voicebox, une intelligence artificielle spécialisée dans la synthèse vocale. Ce modèle est capable de convertir du texte en fichier audio et générer des discours en basant avec ces échantillons de seulement deux secondes. 

meta voicebox
Crédits : 123RF

Comme vous le savez, les principaux acteurs de la Tech se sont lancées dans la course à l'IA. Après le lancement de ChatGPT en fin d'année 2022 et les 10 milliards de Microsoft investis dans la startup OpenAI, les géants du web se sont hâtés pour présenter à leur tour leur propre intelligence artificielle.

Google s'est illustré avec Bard, son IA conversationnelle, tandis que Meta a confirmé le développement de son IA dès avril 2023. Durant les derniers mois, la firme de Menlo Park a publié une multitude de modèles d'IA, à commencer par LLaMA (Large Language Model Meta AI), un modèle de langage open-source.

Il y a un peu, l'entreprise californienne a également dévoilé JEPA, un modèle qui a pour ambition de reproduire la pensée humaine, notamment en analysant et en comprenant des notions et concepts abstraits. Dans un tout autre domaine, Meta a également présenté MusicGen, une IA capable de créer une musique via une description textuelle basique.

meta voicebox
Crédits : Meta

Meta dévoile Voicebox, l'IA capable d'imiter la voix humaine

Or, ce 16 juin 2023, Meta a annoncé “sa nouvelle percée dans le domaine de l'IA générative pour la parole”. Cette IA, c'est Voicebox. Pour résumer, ce modèle d'IA de pointe est spécialisée dans la synthèse vocale. En d'autres termes, elle est capable de créer, modifier ou styliser des fichiers audio.

Abordons tout d'abord la fonctionnalité la plus intéressante (et probablement la plus problématique) de Voicebox : la synthèse texte-parole en contexte. En s'appuyant sur un extrait audio de deux secondes seulement, Voicebox est capable de générer un discours en simulant la voix et le phrasé de la personne entendue dans l'extrait.

De cette manière, Voicebox pourra simuler la voix d'un proche, d'un chanteur ou d'un homme politique. A l'avenir, Meta déclare que Voicebox et d'autres modèles d'IA générative similaires pourront donner des voix naturelles aux assistants vocaux ou aux PNJ dans le métaverse. En outre, ils pourraient également permettre aux malvoyants d'entendre des messages écrits avec les voix de leurs amis.

meta voicebox
Crédits : Meta

A lire également : Après Dall-E et Midjourney, cette nouvelle IA permet de générer une vidéo à partir d’un texte

Edition de fichiers audio et traduction instantanée

Mais ce n'est pas tout puisque Voicebox propose d'autres fonctionnalités :

  • L'édition de l'audio et la réduction de bruit : Voicebox peut recréer une portion de discours interrompue par du bruit ou remplacer des mots écorchés et mal prononcés sans avoir à enregistrer un nouveau un discours dans son intégralité (une sorte de gomme magique à la Google pour l'audio)
  • Traduction multilingue : Voicebox prend en charge six langues pour l'instant (anglais, français, espagnol, allemand, polonais et portugais), ce qui lui permet de transposer un discours dans une autre langue que celle du fichier original (tout en transposant le style et les nuances)

Pour réaliser ses différentes tâches, l'IA de Meta s'est perfectionnée sur plus de 50 000 heures d'extraits audio issus majoritairement de livres audio et de contenus libre de droits. Pour l'instant, Voicebox reste inaccessible au grand public, dans un souci de sécurité. Sans surprise, Meta redoute que son IA soit utilisée à mauvais escient, notamment pour imiter la voix de personnes réelles.

Source : Meta


Abonnez-vous gratuitement à la newsletter

Chaque jour, le meilleur de Phonandroid dans votre boite mail !

Réagissez à cet article !

Demandez nos derniers articles !

Le PS Store de la PS5 affiche des prix différents pour le même jeu si vous êtes connecté à votre compte PlayStation ou non

Un mécanisme de tarification dynamique sur le PS Store modifie les prix des jeux selon certains critères. L’un d’entre eux semble être la connexion ou non à un compte PlayStation…

Le câble inclus avec le Galaxy S26 Ultra n’est pas compatible avec la charge rapide du smartphone

Pour recharger le Galaxy S26 Ultra à pleine vitesse, il ne faut pas utiliser le câble inclus dans la boîte du smartphone. Tout cela n’est pas très intuitif, Samsung.  Certains…

Orange a trouvé la solution contre le spam : l’opérateur va afficher le nom de celui qui appelle

Orange dévoile sa technologie Branded Calling, qui affiche le nom de l’entreprise appelante sur l’écran du destinataire. L’utilisateur pourra ainsi identifier s’il s’agit d’un spam ou s’il souhaite répondre à…

Une sortie dès 2027 pour la PS6 ? La retarder coûterait plus cher à Sony que de payer la RAM au prix fort

La sortie de la PS6 ne serait pas retardée à 2028 ou 2029, comme le clament certaines sources. Malgré la crise de la RAM et du stockage que l’on connaît,…

Ce mail vous paraît louche ? ChatGPT peut vous dire si c’est une arnaque, on vous explique tout

En plus de répondre à toutes vos questions et de vous aider dans de nombreuses situations, savez-vous que ChatGPT peut également devenir un rempart contre les arnaques en ligne ?…

Le Redmi Note 15 Pro 5G perd 191 € sur son prix : une offre flash difficile à ignorer

Le Redmi Note 15 Pro 5G devient beaucoup plus abordable grâce à cette offre à durée limitée. Le smartphone milieu de gamme sorti il y a quelques semaines est actuellement…

Et si la vie sur Terre venait en réalité de Mars ? Cette étude relance une théorie fascinante

Des milliards d’années avant l’apparition de la vie sur Terre, Mars possédait peut-être des lacs et des océans. Certains scientifiques pensent aujourd’hui que des microbes auraient pu voyager entre les…

Samsung partage les premiers détails sur ses lunettes connectées IA et vise un lancement dès 2026

Samsung confirme qu’il ambitionne de lancer sur le marché des lunettes connectées IA dès cette année et dévoile de premières informations à leur sujet. En octobre dernier, Samsung lançait son…

Nouveau prix bas record pour ce airfryer Ninja à double compartiment de 9,5 L, c’est le moment d’en profiter !

Si vous souhaitez acheter une grande friteuse sans huile pour cuisiner pour toute la famille, ce bon plan est fait pour vous. Avec sa capacité totale de 9,5 L, ce…

Jusqu’à 565 € de remise sur les Galaxy S26 et S26 Ultra : derniers jours pour les précommander au meilleur prix

Samsung propose des offres de lancement très généreuses sur les Galaxy S26, S26+ et S26 Ultra. Les trois smartphones bénéficient encore de belles réductions pendant quelques jours. Voici tous les…