Google Assistant : une nouvelle voix humaine impossible à distinguer d’une vraie

Google Assistant aura très bientôt une voix beaucoup plus réaliste. Google est parvenu à développer Tacotron 2, un système capable de transformer des textes en fichiers audio avec une voix impossible à distinguer de celle d'un être humain. L'intelligence artificielle prend en charge la ponctuation, les accents, les majuscules ou même le contexte de la phrase pour nuancer sa prononciation. Les extraits publiés par Google sont tout bonnement impressionnants. 

google assistant voix humaine

Qui ne s'est jamais amusé à faire lire des phrases à la voix robotique de Google Traduction, juste pour se moquer de son étrange accent ? Au fil des années, cette voix bizarre est rentrée dans la légende. Certains sont même parvenus à la détourner de manière artistique, à l'instar du rappeur Orelsan avec ses « Freestyle assistés par ordinateur » (disponibles sur YouTube). Toutefois, une page est sur le point de se tourner avec la disparition de cette voix emblématique. L'époque à laquelle Google Traduction et Google Assistant avaient une drôle de voix sera très bientôt révolue.

Google Assistant : la nouvelle voix Tacotron 2 articule mieux qu'un humain

Google vient de dévoiler une nouvelle voix générée par l'intelligence artificielle. Baptisée Tacotron 2, cette voix est pratiquement impossible à distinguer d'une voix humaine. Le système repose sur deux réseaux de neurones artificiels. Le premier réseau transforme un texte en spectrogramme, à savoir une représentation visuelle des fréquences audio. Ce spectrogramme est ensuite transmis à WaveNet, un système développé par Google DeepMind capable de lire cette représentation pour générer un fichier audio.

Les différents extraits publiés par Google sont tout simplement bluffants. Chaque phrase est lue par une employée de la firme, et par Tacotron 2. Il est très difficile, voire impossible, de savoir si la phrase est lue par le robot ou par l'humaine. Tacotron 2 est capable de nuancer sa prononciation en fonction de la ponctuation, et peut même prononcer les noms les plus complexes.

Cette technologie n'est pas destinée à rester dans un laboratoire : elle remplacera très bientôt la voix actuelle de Google Assistant et Google Traduction. Pour l'heure toutefois, l'intelligence artificielle n'est entraînée qu'à imiter une seule voix de femme anglophone. Elle devra s'entraîner plus longtemps pour maîtriser plusieurs langues et pour parler comme un homme. En attendant, découvrez par vous-même cette nouvelle voix à travers une comparaison avec une voix humaine suivie par la lecture de phrases complexes.

Via arxiv.org/abs/1712.05884

Réagissez à cet article !

Demandez nos derniers articles !

Forza Horizon 6 : vous devez absolument mettre à jour cette application pour jouer au jeu sur Windows 11

Playground Games, le studio développeur de Forza Horizon 6, vient de dévoiler une information de taille pour tous les joueurs PC. En effet, le jeu ne fonctionnera pas correctement tant…

Votre smartphone Samsung va bientôt s’assurer que vous ne ratiez aucune notification importante

Plusieurs lignes de code retrouvées au sein de One UI 9 laissent penser que Samsung travaille sur un système pour ne plus rater aucun notification. Pour cela, le géant coréen…

L’App Store tel qu’on le connaît pourrait bientôt disparaître à cause de l’IA, voici pourquoi

Apple avait récemment pris des mesures sévères contre certaines applications IA sur l’App Store. Un rapport révèle que la firme envisage désormais le mouvement inverse. La boutique d’applications de l’iPhone…

Windows 11 : Microsoft veut en finir avec les drivers défectueux qui mettent à genoux votre PC

Microsoft a annoncé la mise en place d’un nouveau programme censé résoudre l’un de pires problèmes de Windows 11. En effet, ce dernier vise à mettre fin au déploiement de…

Netflix va diffuser des films d’animation générés par IA

Netflix a créé un nouveau studio en interne, INKubator, dont la mission est de produire des courts-métrages animés à l’aide de l’IA générative. Si une partie du public opère une…

Galaxy Tab S11 Ultra 5G : avec 450 € de réduction, la tablette haut de gamme de Samsung est à son prix le plus bas pour quelques heures encore !

La tablette premium de Samsung vous fait de l’oeil, mais vous hésitez à sauter le pas ? La version 5G de la Galaxy Tab S11 Ultra est actuellement à prix…

HONOR confirme la date de sortie de son Robot Phone et dévoile un partenariat inattendu

Le HONOR Robot Phone n’était jusqu’ici qu’une promesse de salon. La marque vient de lui fixer une date de sortie concrète. Et elle s’est offert un partenaire de poids pour…

Votre smartphone Android n’est pas compatible AirDrop ? Google lance une alternative pour partager des fichiers à un iPhone

La compatibilité entre Quick Share et AirDrop ne sera pas disponible sur la majorité des smartphones Android. Google a prévu un système alternatif pour ces appareils. Fin 2025, Google a…

Rachat de SFR par Orange, Free et Bouygues : l’échéance du 15 mai est passée, voici la nouvelle date butoir

Le rachat de SFR par Bouygues Telecom, Orange et Free semblait en bonne voie : Altice France a accordé le 17 avril dernier des négociations exclusives au consortium. Mais cette exclusivité…

Cette nouveauté transforme ChatGPT en vrai espace de travail pour tous les utilisateurs

Jusqu’ici, les fichiers uploadés dans ChatGPT disparaissaient à la fermeture d’une conversation. OpenAI vient d’y remédier avec une bibliothèque persistante qui transforme le chatbot en véritable espace de travail. Et…