L’IA Gemini de Google peut désormais écouter des fichiers audio pour vous aider

Par William Zimmer Le 11/04/2024 0 com

Quelques semaines seulement après avoir dévoilé son nouveau modèle d'IA phare, Gemini, destiné à concurrencer le ChatGPT d'OpenAI, Google a déjà donné un coup de fouet à cette technologie en la dotant de capacités de compréhension audio.

Selon un rapport d'Android Headlines, la dernière version 1.5 Pro de Gemini peut désormais ingérer, traiter et comprendre les données audio au-delà du texte et des images. Cette étape importante permet à Gemini de transcrire, de résumer et d'analyser des fichiers audio tels que des podcasts, des conférences, des appels à bénéfices et plus encore, directement à partir de la source audio d'origine.

Dans le contexte actuel, la plupart des outils de transcription et de résumé de l'IA s'appuient sur la conversion de l'audio en texte avant d'analyser le contenu. Mais Gemini 1.5 Pro supprime cette étape intermédiaire en comprenant l'audio à un niveau plus profond, ce qui peut améliorer la précision des réponses.

Lire également – Gemini : après Messages, l’IA de Google débarque dans cette application de la firme

Gemini peut comprendre votre voix, ou d’autres fichiers audio

Les compétences audio améliorées élargissent considérablement l'utilité de Gemini dans toute une série de cas d'utilisation professionnelle et créative. Imaginez que vous puissiez télécharger l'enregistrement d'une réunion d'entreprise de trois heures et recevoir en quelques secondes un résumé concis des points clés et des actions à entreprendre, généré par l'IA.

Les podcasters et les créateurs audio pourraient utiliser Gemini pour l'analyse thématique, les notes de préparation d'émissions et même la création de contenu audio assistée par la compréhension de l'IA. Les possibilités sont pratiquement infinies lorsque l'audio rejoint le texte et les images dans le répertoire de Gemini. Il s'agit d'un élément essentiel de la feuille de route de Google visant à faire de son modèle d'IA phare un véritable assistant multimodal capable de traiter n'importe quel type de données. D’ailleurs, Google a récemment noué un partenariat avec un géant de la publicité, donc cette nouvelle fonctionnalité pourrait bien l’aider à créer de nouvelles annonces.

Google semble adopter une approche prudente et contrôlée dans un premier temps. Pour l'instant, les nouvelles compétences audio de Gemini ne seront disponibles que via la plateforme de développement Vertex AI de Google et ses outils AI Studio, et non via le service disponible pour les consommateurs. Il s'agit d'une mesure prudente qui permettra à Google de valider rigoureusement la qualité et la robustesse des capacités audio de Gemini avant de les proposer à tous.

Abonnez-vous gratuitement à la newsletter

Réagissez à cet article !

Voir tous les commentaires

Demandez nos derniers articles !

Ce prof utilise l’IA pour faire virer le proviseur de son lycée, les conséquences sont massives
Un professeur d’EPS s’est servi d’un outil IA pour générer un message haineux avec la voix de son proviseur dans le but de lui faire perdre son poste. Il avait presque réussi, mais depuis, tout l’établissement subit les conséquences. La…

IA 26/04/2024
ChatGPT : l’application Android et iOS rattrape enfin son retard sur la version web avec cette fonctionnalité essentielle
Dans une prochaine mise à jour, les utilisateurs smartphone de ChatGPT vont enfin profiter d’une fonctionnalité disponible uniquement sur la version web. Une raison de plus de n’utiliser l’IA que sur Android ou iOS. À bien des égards, il est…

IA 25/04/2024
Adobe lance une IA qui va faire disparaitre les vidéos floues d’Internet
Le dernier projet d’intelligence artificielle issu des laboratoires de recherche d’Adobe vise à débarrasser définitivement le monde des vidéos floues et pixellisées. Voici ce que l’on sait à son sujet. Adobe vient de lever le voile sur VideoGigaGAN, un nouveau…

IA 25/04/2024
Arnaque ou non ? La CPAM sème le doute en faisant signer ses courriers par un robot
Un assuré installé dans les Landes a reçu en janvier 2024 un courrier de la CPAM. Devant la signature étrange, il pense rapidement à une arnaque. Alors, escroquerie confirmée ou simple erreur de la caisse d’assurance maladie ? Bernard Larrat,…

IA 24/04/2024
Bonne nouvelle, l’IA Gemini de Google pourrait tourner sur votre vieux smartphone
Un récent changement dans l’intelligence artificielle Gemini de Google laisse penser qu’elle sera utilisable même sur des smartphones datant de plusieurs années. Pas besoin d’acheter le dernier modèle en date pour en profiter. Il n’y a pas si longtemps, Google…

IA 24/04/2024
IA : Photoshop peut générer des images à partir de textes, plus besoin de maîtriser l’outil
Grâce à l’intégration de l’intelligence artificielle directement dans Photoshop, le logiciel devient capable de créer des images à partir de requêtes écrites. Son utilisation est à la portée de tous. Adobe, entreprise connue pour ces logiciels de création comme Photoshop,…

IA 23/04/2024
Gemini : l’IA de Google va vous répondre encore plus rapidement qu’avant sur Android
Bonne nouvelle pour les utilisateurs de l’application Gemini, la nouvelle IA de Google, puisque le géant américain vient de la mettre à jour pour lui permettre de vous répondre « en temps réel ». L’assistant chatbot Gemini de Google n’a pas vraiment…

IA 22/04/2024
Taylor Swift : ce nouvel album divise les fans, aurait-il été généré par l’IA ?
Alors que le monde de la musique attend le nouvel album de Taylor Swift, “The Tortured Poets Department”, qui sortira aujourd’hui, le 19 avril, un étrange doppelgänger artificiel a fait son apparition sur les plateformes de streaming. Hier, les fans…

IA 19/04/2024
Une IA a réussi son premier combat aérien à face un pilote humain
La DARPA, l’agence américaine spécialisée dans le développement des technologies militaires, vient de faire part d’un succès important. Une IA intégrée dans un avion de chasse modifié est parvenu à affronter sans difficulté un pilote humain lors d’un entraînement au…

IA 18/04/2024
La SNCF et la RATP vont vous surveiller grâce à l’IA, Paris donne son accord pour un essai
La ville de Paris autorise la SNCF et la RATP à utiliser la vidéosurveillance algorithmique le temps d’un week-end de test. L’intelligence artificielle va pouvoir analyser les images capturées lors de deux événements spécifiques. On le répète souvent : l’intelligence…

IA 18/04/2024

Newsletter