Meta présente Voicebox, une IA capable de reproduire n’importe quel voix humaine

Par Kevin Dachez Le 19/06/2023 0 com

Meta vient de présenter officiellement Voicebox, une intelligence artificielle spécialisée dans la synthèse vocale. Ce modèle est capable de convertir du texte en fichier audio et générer des discours en basant avec ces échantillons de seulement deux secondes.

Comme vous le savez, les principaux acteurs de la Tech se sont lancées dans la course à l'IA. Après le lancement de ChatGPT en fin d'année 2022 et les 10 milliards de Microsoft investis dans la startup OpenAI, les géants du web se sont hâtés pour présenter à leur tour leur propre intelligence artificielle.

Google s'est illustré avec Bard, son IA conversationnelle, tandis que Meta a confirmé le développement de son IA dès avril 2023. Durant les derniers mois, la firme de Menlo Park a publié une multitude de modèles d'IA, à commencer par LLaMA (Large Language Model Meta AI), un modèle de langage open-source.

Il y a un peu, l'entreprise californienne a également dévoilé JEPA, un modèle qui a pour ambition de reproduire la pensée humaine, notamment en analysant et en comprenant des notions et concepts abstraits. Dans un tout autre domaine, Meta a également présenté MusicGen, une IA capable de créer une musique via une description textuelle basique.

Meta dévoile Voicebox, l'IA capable d'imiter la voix humaine

Or, ce 16 juin 2023, Meta a annoncé “sa nouvelle percée dans le domaine de l'IA générative pour la parole”. Cette IA, c'est Voicebox. Pour résumer, ce modèle d'IA de pointe est spécialisée dans la synthèse vocale. En d'autres termes, elle est capable de créer, modifier ou styliser des fichiers audio.

Abordons tout d'abord la fonctionnalité la plus intéressante (et probablement la plus problématique) de Voicebox : la synthèse texte-parole en contexte. En s'appuyant sur un extrait audio de deux secondes seulement, Voicebox est capable de générer un discours en simulant la voix et le phrasé de la personne entendue dans l'extrait.

De cette manière, Voicebox pourra simuler la voix d'un proche, d'un chanteur ou d'un homme politique. A l'avenir, Meta déclare que Voicebox et d'autres modèles d'IA générative similaires pourront donner des voix naturelles aux assistants vocaux ou aux PNJ dans le métaverse. En outre, ils pourraient également permettre aux malvoyants d'entendre des messages écrits avec les voix de leurs amis.

A lire également : Après Dall-E et Midjourney, cette nouvelle IA permet de générer une vidéo à partir d’un texte

Edition de fichiers audio et traduction instantanée

Mais ce n'est pas tout puisque Voicebox propose d'autres fonctionnalités :

L'édition de l'audio et la réduction de bruit : Voicebox peut recréer une portion de discours interrompue par du bruit ou remplacer des mots écorchés et mal prononcés sans avoir à enregistrer un nouveau un discours dans son intégralité (une sorte de gomme magique à la Google pour l'audio)
Traduction multilingue : Voicebox prend en charge six langues pour l'instant (anglais, français, espagnol, allemand, polonais et portugais), ce qui lui permet de transposer un discours dans une autre langue que celle du fichier original (tout en transposant le style et les nuances)

Pour réaliser ses différentes tâches, l'IA de Meta s'est perfectionnée sur plus de 50 000 heures d'extraits audio issus majoritairement de livres audio et de contenus libre de droits. Pour l'instant, Voicebox reste inaccessible au grand public, dans un souci de sécurité. Sans surprise, Meta redoute que son IA soit utilisée à mauvais escient, notamment pour imiter la voix de personnes réelles.

Source : Meta

Abonnez-vous gratuitement à la newsletter

Réagissez à cet article !

Voir tous les commentaires

Demandez nos derniers articles !

WhatsApp : vos vidéos ne s’envoient plus sur Android ? C’est un bug !
Les utilisateurs d’Android qui tentent de partager des fichiers vidéo via WhatsApp se sont heurtés à un obstacle frustrant ces dernières heures, puisque leurs vidéos refusaient catégoriquement de s’envoyer. Si vous utilisez WhatsApp sur un smartphone Android, vous avez peut-être…

Réseaux Sociaux 29/04/2024
WhatsApp : plus besoin de mot de passe pour vous connecter à l’application sur iPhone
WhatsApp met en place la prise en charge des connexions par passkey sur son application iOS, dans le but d’apporter plus de sécurité et de commodité à ses utilisateurs. Les passkeys, la nouvelle norme d’authentification soutenue par les grandes entreprises…

Réseaux Sociaux 25/04/2024
Facebook, Whatsapp… Meta vous force à utiliser son IA, vous n’avez pas le choix !
L’intégration de l’IA de Meta dans ses applications mobiles comme Facebook, Instagram, Messenger et WhatsApp devient inévitable. Avec le déploiement de la nouvelle version de son modèle linguistique, Llama 3, Meta propose des fonctionnalités avancées difficiles à ignorer. Ceux qui…

Réseaux Sociaux 19/04/2024
TikTok : l’Europe s’inquiète de cette fonctionnalité et demande des explications au réseau social
La Commission européenne ordonne à TikTok de lui fournir des informations concernant une fonctionnalité implémentée dans TikTok Lite, une application disponible en France depuis peu. Rien ne va plus pour le réseau social chinois TikTok. Menacé d’être banni des États-Unis,…

Réseaux Sociaux 17/04/2024
WhatsApp facilite la recherche des messages non lus, de nouveaux filtres arrivent
Pour ceux qui se sentent submergés par un flux infini de conversations sur WhatsApp, Meta va déployer une fonctionnalité qui devrait largement vous aider à rester à jour. Trouver les conversations auxquelles vous devez donner la priorité peut s’avérer compliqué….

Réseaux Sociaux 17/04/2024
WhatsApp veut pousser vos proches à créer un compte sur son application, voici comment
Avec toutes les différentes applications de messagerie, il peut être difficile d’amener vos amis et votre famille à utiliser la même plateforme. Cependant, WhatsApp aurait peut-être une idée pour augmenter son nombre d’utilisateurs. WhatsApp s’efforce vraisemblablement d’élargir sa base d’utilisateurs…

Réseaux Sociaux 16/04/2024
TikTok : le “piratage” de films et de séries a un effet plutôt inattendu, découvrez lequel
Une nouvelle étude universitaire bouscule les idées reçues sur le partage non autorisé de vidéos, en constatant que les clips “piratés” condensés de séries télévisées sur des plateformes telles que TikTok peuvent avoir un effet inattendu sur les vrais œuvres….

Réseaux Sociaux 15/04/2024
Instagram : bientôt, vous ne pourrez plus échapper aux statuts de vos amis
Instagram annonce une nouvelle mise à jour pour les statuts qui seront maintenant mieux mises en valeur dans l’application. Désormais, ces messages éphémères ne se limiteront plus à la boîte de réception mais apparaîtront aussi directement sur les profils des…

Réseaux Sociaux 12/04/2024
Instagram : vos enfants ne tomberont plus par mégarde sur des photos intimes envoyées par message
Alors que les préoccupations grandissent concernant la sécurité en ligne des jeunes, Instagram annonce le déploiement d’un dispositif de floutage automatique pour les messages à caractère inapproprié. Ce projet de Meta vise à protéger les adolescents des contenus sensibles mais…

Réseaux Sociaux 11/04/2024
Phonandroid est sur Discord : rejoignez-nous et discutons !
Phonandroid débarque sur Discord. Pour nous rapprocher encore de notre communauté nous nous lançons sur le service de communication le plus plébiscité par les fans de jeux vidéo. Sur nos salons vous pourrez discuter entre vous mais également avec nous ! Venez vite !

Réseaux Sociaux 10/04/2024

Newsletter