Les voix de cette IA sont si réalistes qu’elles inquiètent les utilisateurs

Sesame, une start-up basée à San Francisco, vient de dévoiler une technologie de voix artificielle d'un réalisme sans précédent. Cette avancée en intelligence artificielle (IA) suscite autant d'enthousiasme que d'inquiétude parmi les premiers utilisateurs, certains rapportant se sentir « perturbés » lors de leurs interactions avec le système.

intelligence artificielle cyberpunk

Le 27 février 2025, Sesame a présenté son Modèle de Parole Conversationnelle, fruit d'un entraînement sur près d'un million d'heures de données audio en anglais. Deux personnages IA, Maya et Miles, sont désormais accessibles au public pour des démonstrations via le blog de recherche de l'entreprise. Cette technologie vise à atteindre ce que Sesame appelle la « présence vocale », une qualité de voix si naturelle qu'elle devient indiscernable d'une voix humaine.

Fondée par Brendan Iribe, co-fondateur d'Oculus, Sesame a concentré ses efforts sur quatre aspects clés : l'intelligence émotionnelle, la dynamique conversationnelle, la conscience contextuelle et la cohérence de la personnalité. L'objectif est de créer des interactions vocales avec les ordinateurs aussi naturelles et fluides qu'avec un être humain.

Lire égalementCette IA peut imiter votre voix à partir de quelques secondes d’enregistrement, c’est effrayant

Des réactions mitigées face à cette innovation

Les réactions des utilisateurs et des experts du secteur sont partagées. Sean Hollister de The Verge a qualifié cette technologie de « premier assistant vocal avec lequel j'ai envie de parler plus d'une fois ». Le PDG de Shopify, Tobi Lutke, a publiquement salué cette innovation comme « absolument incroyable ». Cependant, certains utilisateurs, comme Mark Hachman de PCWorld, ont rapporté un sentiment de malaise face au réalisme troublant de ces voix artificielles.

Sesame envisage d'associer cette technologie vocale à des lunettes IA légères, offrant ainsi un « accès pratique à un compagnon capable d'observer le monde à vos côtés ». Cette perspective soulève des questions sur la vie privée et l'omniprésence de l'IA dans notre quotidien.

Les applications potentielles de cette technologie sont vastes, allant de l'amélioration des centres d'appels à l'apprentissage des langues. Sesame prévoit d'étendre le support à plus de 20 langues et de rendre open-source certains composants clés sous licence Apache 2.0. La percée de Sesame laisse présager que les interfaces centrées sur la voix pourraient définir la prochaine vague d'interaction homme-machine, pour le meilleur ou pour le pire.


Abonnez-vous gratuitement à la newsletter
Chaque jour, le meilleur de Phonandroid dans votre boite mail !
Réagissez à cet article !
Demandez nos derniers  !