Google Assistant : une nouvelle voix humaine impossible à distinguer d’une vraie

Google Assistant aura très bientôt une voix beaucoup plus réaliste. Google est parvenu à développer Tacotron 2, un système capable de transformer des textes en fichiers audio avec une voix impossible à distinguer de celle d'un être humain. L'intelligence artificielle prend en charge la ponctuation, les accents, les majuscules ou même le contexte de la phrase pour nuancer sa prononciation. Les extraits publiés par Google sont tout bonnement impressionnants. 

Qui ne s'est jamais amusé à faire lire des phrases à la voix robotique de Google Traduction, juste pour se moquer de son étrange accent ? Au fil des années, cette voix bizarre est rentrée dans la légende. Certains sont même parvenus à la détourner de manière artistique, à l'instar du rappeur Orelsan avec ses « Freestyle assistés par ordinateur » (disponibles sur YouTube). Toutefois, une page est sur le point de se tourner avec la disparition de cette voix emblématique. L'époque à laquelle Google Traduction et Google Assistant avaient une drôle de voix sera très bientôt révolue.

Google Assistant : la nouvelle voix Tacotron 2 articule mieux qu'un humain

Google vient de dévoiler une nouvelle voix générée par l'intelligence artificielle. Baptisée Tacotron 2, cette voix est pratiquement impossible à distinguer d'une voix humaine. Le système repose sur deux réseaux de neurones artificiels. Le premier réseau transforme un texte en spectrogramme, à savoir une représentation visuelle des fréquences audio. Ce spectrogramme est ensuite transmis à WaveNet, un système développé par Google DeepMind capable de lire cette représentation pour générer un fichier audio.

Les différents extraits publiés par Google sont tout simplement bluffants. Chaque phrase est lue par une employée de la firme, et par Tacotron 2. Il est très difficile, voire impossible, de savoir si la phrase est lue par le robot ou par l'humaine. Tacotron 2 est capable de nuancer sa prononciation en fonction de la ponctuation, et peut même prononcer les noms les plus complexes.

Cette technologie n'est pas destinée à rester dans un laboratoire : elle remplacera très bientôt la voix actuelle de Google Assistant et Google Traduction. Pour l'heure toutefois, l'intelligence artificielle n'est entraînée qu'à imiter une seule voix de femme anglophone. Elle devra s'entraîner plus longtemps pour maîtriser plusieurs langues et pour parler comme un homme. En attendant, découvrez par vous-même cette nouvelle voix à travers une comparaison avec une voix humaine suivie par la lecture de phrases complexes.

google-1
google-2
google-3
google-4
google-5
Voir les commentaires
Ailleurs sur le web