L’IA Gemini de Google peut désormais écouter des fichiers audio pour vous aider

Quelques semaines seulement après avoir dévoilé son nouveau modèle d'IA phare, Gemini, destiné à concurrencer le ChatGPT d'OpenAI, Google a déjà donné un coup de fouet à cette technologie en la dotant de capacités de compréhension audio.

Selon un rapport d'Android Headlines, la dernière version 1.5 Pro de Gemini peut désormais ingérer, traiter et comprendre les données audio au-delà du texte et des images. Cette étape importante permet à Gemini de transcrire, de résumer et d'analyser des fichiers audio tels que des podcasts, des conférences, des appels à bénéfices et plus encore, directement à partir de la source audio d'origine.

Dans le contexte actuel, la plupart des outils de transcription et de résumé de l'IA s'appuient sur la conversion de l'audio en texte avant d'analyser le contenu. Mais Gemini 1.5 Pro supprime cette étape intermédiaire en comprenant l'audio à un niveau plus profond, ce qui peut améliorer la précision des réponses.

Lire également – Gemini : après Messages, l’IA de Google débarque dans cette application de la firme

Gemini peut comprendre votre voix, ou d’autres fichiers audio

Les compétences audio améliorées élargissent considérablement l'utilité de Gemini dans toute une série de cas d'utilisation professionnelle et créative. Imaginez que vous puissiez télécharger l'enregistrement d'une réunion d'entreprise de trois heures et recevoir en quelques secondes un résumé concis des points clés et des actions à entreprendre, généré par l'IA.

Les podcasters et les créateurs audio pourraient utiliser Gemini pour l'analyse thématique, les notes de préparation d'émissions et même la création de contenu audio assistée par la compréhension de l'IA. Les possibilités sont pratiquement infinies lorsque l'audio rejoint le texte et les images dans le répertoire de Gemini. Il s'agit d'un élément essentiel de la feuille de route de Google visant à faire de son modèle d'IA phare un véritable assistant multimodal capable de traiter n'importe quel type de données. D’ailleurs, Google a récemment noué un partenariat avec un géant de la publicité, donc cette nouvelle fonctionnalité pourrait bien l’aider à créer de nouvelles annonces.

Google semble adopter une approche prudente et contrôlée dans un premier temps. Pour l'instant, les nouvelles compétences audio de Gemini ne seront disponibles que via la plateforme de développement Vertex AI de Google et ses outils AI Studio, et non via le service disponible pour les consommateurs. Il s'agit d'une mesure prudente qui permettra à Google de valider rigoureusement la qualité et la robustesse des capacités audio de Gemini avant de les proposer à tous.


Réagissez à cet article !

Demandez nos derniers articles !

Acer Swift Go 14 : avec 250 € de réduction, cet excellent PC portable avec écran OLED passe à petit prix !

Les prix continuent de chuter à l’occasion du Prime Day. Nous avons trouvé une belle offre sur le puissant Acer Swift Go 14 qui passe à 599 € au lieu…

Drone DJI Mini 3 Fly More Combo : le pack ultra complet est à -40% pour le Prime Day

Vous cherchez un petit drone pas cher mais complet qui permet de faire des vidéos et photos d’excellente qualité ? Ne cherchez plus, voici une offre immanquable sur le DJI…

Test Fiido C11 Pro : un vélo chic et abordable

Fiido est une marque asiatique désormais solidement établie en Europe et qui développe une large gamme de vélos à assistance électrique qui se caractérisent par leur excellent rapport qualité/prix. Le…

AirPods Max USB-C : près de 200 € de réduction sur l’incroyable casque d’Apple, vite !

C’est déjà le troisième (et avant-dernier) jour du Prime Day sur Amazon. Vous connaissez la musique : des prix super bas réservés aux abonnés Prime. Pour cette fois-ci, nous avons…

Quels sont les meilleurs badges télépéage ? Notre sélection des abonnements à choisir

Fulli, Ulys, ou encore Bip&Go, les solutions de télépéage permettent de gagner du temps quand on roule sur l’autoroute. L’offre est assez diversifiée, mais tous les abonnements proposés par ces…

La souris gaming Logitech G502 Hero passe est à 28 € seulement, mais il va falloir faire vite !

Les bons plans continuent sur Amazon, et c’est maintenant au tour de la souris gaming Logitech G502 Hero d’être à prix cassé. Vous pouvez ainsi l’avoir à 28,49 € alors…

Si vous recevez cet appel d’Enedis, raccrochez immédiatement

Les arnaques par téléphone se multiplient et changent sans cesse de visage. Cette fois, les escrocs empruntent l’identité d’Enedis, le gestionnaire du réseau électrique français. Leur objectif reste toujours le…

GTA 6 : date de sortie, prix, plateformes… le point sur toutes les infos

GTA 6 est sans conteste le jeu le plus attendu de la planète. Un titre dont l’ampleur est inédite dans l’histoire du jeu vidéo. Dans ce dossier, on a compilé…

Un grand fabricant lâche une mauvaise nouvelle sur les prix de la RAM, préparez-vous au pire

Les prix de la RAM s’envolent depuis des mois, portés par la demande folle de l’intelligence artificielle. Un géant des composants livre désormais ses prévisions, et elles sont mauvaises. Le…

Soldes : le puissant Lenovo IdeaPad Slim 3 avec 1To de stockage passe à moitié prix avec ce code !

Vous attendiez les Soldes pour trouver un puissant ordinateur portable à prix cassé ? Ce bon plan est fait pour vous ! Le Lenovo IdeaPad Slim 3 de 15 pouces…