L’IA Gemini de Google peut désormais écouter des fichiers audio pour vous aider

Quelques semaines seulement après avoir dévoilé son nouveau modèle d'IA phare, Gemini, destiné à concurrencer le ChatGPT d'OpenAI, Google a déjà donné un coup de fouet à cette technologie en la dotant de capacités de compréhension audio.

Selon un rapport d'Android Headlines, la dernière version 1.5 Pro de Gemini peut désormais ingérer, traiter et comprendre les données audio au-delà du texte et des images. Cette étape importante permet à Gemini de transcrire, de résumer et d'analyser des fichiers audio tels que des podcasts, des conférences, des appels à bénéfices et plus encore, directement à partir de la source audio d'origine.

Dans le contexte actuel, la plupart des outils de transcription et de résumé de l'IA s'appuient sur la conversion de l'audio en texte avant d'analyser le contenu. Mais Gemini 1.5 Pro supprime cette étape intermédiaire en comprenant l'audio à un niveau plus profond, ce qui peut améliorer la précision des réponses.

Lire également – Gemini : après Messages, l’IA de Google débarque dans cette application de la firme

Gemini peut comprendre votre voix, ou d’autres fichiers audio

Les compétences audio améliorées élargissent considérablement l'utilité de Gemini dans toute une série de cas d'utilisation professionnelle et créative. Imaginez que vous puissiez télécharger l'enregistrement d'une réunion d'entreprise de trois heures et recevoir en quelques secondes un résumé concis des points clés et des actions à entreprendre, généré par l'IA.

Les podcasters et les créateurs audio pourraient utiliser Gemini pour l'analyse thématique, les notes de préparation d'émissions et même la création de contenu audio assistée par la compréhension de l'IA. Les possibilités sont pratiquement infinies lorsque l'audio rejoint le texte et les images dans le répertoire de Gemini. Il s'agit d'un élément essentiel de la feuille de route de Google visant à faire de son modèle d'IA phare un véritable assistant multimodal capable de traiter n'importe quel type de données. D’ailleurs, Google a récemment noué un partenariat avec un géant de la publicité, donc cette nouvelle fonctionnalité pourrait bien l’aider à créer de nouvelles annonces.

Google semble adopter une approche prudente et contrôlée dans un premier temps. Pour l'instant, les nouvelles compétences audio de Gemini ne seront disponibles que via la plateforme de développement Vertex AI de Google et ses outils AI Studio, et non via le service disponible pour les consommateurs. Il s'agit d'une mesure prudente qui permettra à Google de valider rigoureusement la qualité et la robustesse des capacités audio de Gemini avant de les proposer à tous.


Réagissez à cet article !

Demandez nos derniers articles !

GTA 6 prépare ses versions physiques, Android Auto perd une application phare, c’est le récap’ de la semaine

Le très attendu jeu de Rockstar prévoit des boîtes avec disque, un outil de lecture vidéo tire sa révérence dans nos véhicules, la dalle protectrice du Galaxy S26 Ultra donne…

Google améliore enfin le Fitbit Air, les choses vont changer

Le bracelet connecté de Google, le Fitbit Air, s’améliore. La firme de Mountain View est en effet en train de déployer un important correctif, qui devrait largement améliorer l’expérience des…

Démarchage téléphonique : le Conseil constitutionnel censure la loi, voici ce qui va changer

Véritable fléau des temps modernes, le démarchage téléphonique pourrait bientôt revenir en masse. Suite à une action en justice d’Orange, le Conseil constitutionnel a en effet censuré plusieurs dispositions d’une…

Test Fiido T2 : Le vélo pour toute la famille sans se ruiner

Le constructeur Fiido ne pouvait passer à côté du segment des longtails, des vélos à assistance électrique pensés pour transporter confortablement et en toute sécurité les enfants. Voici le nouveau…

C’est la fin pour Aibo : Sony enterre son chien-robot emblématique

Le chien-robot ERS-1000 Aibo de Sony, c’est bientôt terminé. Le fabricant a en effet annoncé son intention de cesser de vendre l’adorable compagnon robotique dans son pays d’origine, le Japon….

PS6 portable : Sony lâche un énorme indice, elle pourrait débarquer plus tôt que prévu

Après la PS5 Pro, une PlayStation 6 portable pourrait bien devenir réalité. C’est en tout cas ce que semble suggérer le patron de Sony Interactive Entertainment, Hideaki Nishino, au cours…

La crise de la RAM menace l’iPhone 18, Apple pourrait sacrifier une partie d’iOS 27

La crise de la RAM pourrait faire une victime de plus. À cause de celle-ci, l’iPhone 18 d’Apple pourrait ainsi être privé de certaines fonctionnalités offertes par iOS 27. L’actuelle…

GTA 6 sur Switch 2 ? Rockstar prépare une énorme surprise, vous n’êtes pas prêts

Initialement disponible sur PS5 et Xbox Series X/S, le futur banger de Rockstar pourrait bien débarquer sur la console portable de Nintendo. Un leaker affirme en effet que GTA 6…

Appels indésirables incessants : cette solution efficace est proposée par NordVPN !

Tout le monde connaît NordVPN, le service VPN le plus avancé et le plus complet du marché. Mais cette solution pour sécuriser votre vie en ligne vient de dévoiler un…

Combien d’emplois ont été perdus à cause de l’IA ? Cet outil nous donne la réponse

Face aux inquiétudes concernant les conséquences de l’IA sur le marché du travail, la Californie a mis en ligne un outil de suivi des pertes d’emploi directement liées à cette…