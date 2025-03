Vous rêvez de transformer vos longs documents en podcasts captivants ? Google exauce vos vœux ! Grâce à la nouvelle fonctionnalité de Gemini, vos Google Docs prennent vie sous forme de conversations audio animées. Fini les lectures fastidieuses, place à une expérience auditive immersive.

La firme de Mountain View vient d'annoncer le déploiement d'une fonctionnalité révolutionnaire pour son modèle d'IA Gemini : la capacité de transformer divers types de documents en conversations audio de style podcast. Cette innovation, baptisée « Audio Overviews », promet de changer radicalement la manière dont nous assimilons l'information complexe.

Initialement développée pour NotebookLM, l'outil de prise de notes générative de Google, cette fonctionnalité est désormais accessible aux utilisateurs de Gemini et Gemini Advanced dans le monde entier, pour le moment uniquement en anglais.

Lire également – Ce malware se cache dans Google Docs et vole vos mots de passe ou vos conversations privées, faites attention

Une expérience d'écoute immersive et personnalisée

Le principe d'Audio Overviews est simple mais puissant : l'utilisateur télécharge un document (qu'il s'agisse de notes de cours, de comptes-rendus de réunion, de présentations, de fils de discussion par e-mail ou de rapports) dans Gemini. L'IA analyse alors le contenu et génère une conversation audio entre deux « hôtes » virtuels.

Ces hôtes ne se contentent pas de lire le document. Ils résument le matériel, établissent des liens entre les différents sujets abordés, engagent un dialogue dynamique et offrent des perspectives uniques sur le contenu. L'objectif est de créer une expérience d'écoute engageante qui facilite la compréhension et la mémorisation des informations.

En parallèle, Google introduit également « Canvas », un espace interactif permettant aux utilisateurs de Gemini de créer, rédiger ou affiner des documents et du code. Canvas offre des retours et des aperçus en temps réel, permettant par exemple d'ajuster le ton, la longueur ou le formatage d'un texte de manière instantanée et intuitive.

Pour les professionnels et les étudiants confrontés quotidiennement à une masse d'informations à traiter, ces nouvelles fonctionnalités de Gemini représentent un gain de temps et d'efficacité considérable. Elles ouvrent également de nouvelles perspectives en matière d'accessibilité, permettant par exemple aux personnes malvoyantes ou ayant des difficultés de lecture de consommer plus facilement du contenu complexe.