L’IA Gemini de Google peut désormais écouter des fichiers audio pour vous aider

Quelques semaines seulement après avoir dévoilé son nouveau modèle d'IA phare, Gemini, destiné à concurrencer le ChatGPT d'OpenAI, Google a déjà donné un coup de fouet à cette technologie en la dotant de capacités de compréhension audio.

Selon un rapport d'Android Headlines, la dernière version 1.5 Pro de Gemini peut désormais ingérer, traiter et comprendre les données audio au-delà du texte et des images. Cette étape importante permet à Gemini de transcrire, de résumer et d'analyser des fichiers audio tels que des podcasts, des conférences, des appels à bénéfices et plus encore, directement à partir de la source audio d'origine.

Dans le contexte actuel, la plupart des outils de transcription et de résumé de l'IA s'appuient sur la conversion de l'audio en texte avant d'analyser le contenu. Mais Gemini 1.5 Pro supprime cette étape intermédiaire en comprenant l'audio à un niveau plus profond, ce qui peut améliorer la précision des réponses.

Lire également – Gemini : après Messages, l’IA de Google débarque dans cette application de la firme

Gemini peut comprendre votre voix, ou d’autres fichiers audio

Les compétences audio améliorées élargissent considérablement l'utilité de Gemini dans toute une série de cas d'utilisation professionnelle et créative. Imaginez que vous puissiez télécharger l'enregistrement d'une réunion d'entreprise de trois heures et recevoir en quelques secondes un résumé concis des points clés et des actions à entreprendre, généré par l'IA.

Les podcasters et les créateurs audio pourraient utiliser Gemini pour l'analyse thématique, les notes de préparation d'émissions et même la création de contenu audio assistée par la compréhension de l'IA. Les possibilités sont pratiquement infinies lorsque l'audio rejoint le texte et les images dans le répertoire de Gemini. Il s'agit d'un élément essentiel de la feuille de route de Google visant à faire de son modèle d'IA phare un véritable assistant multimodal capable de traiter n'importe quel type de données. D’ailleurs, Google a récemment noué un partenariat avec un géant de la publicité, donc cette nouvelle fonctionnalité pourrait bien l’aider à créer de nouvelles annonces.

Google semble adopter une approche prudente et contrôlée dans un premier temps. Pour l'instant, les nouvelles compétences audio de Gemini ne seront disponibles que via la plateforme de développement Vertex AI de Google et ses outils AI Studio, et non via le service disponible pour les consommateurs. Il s'agit d'une mesure prudente qui permettra à Google de valider rigoureusement la qualité et la robustesse des capacités audio de Gemini avant de les proposer à tous.


Réagissez à cet article !

Demandez nos derniers articles !

Canal+ aurait déclaré la guerre à Disney : il l’accuserait d’avoir siphonné une partie de ses données clients

Canal+ multiplie les procédures pour faire valoir ses droits. Mais le groupe audiovisuel français ne s’attaque pas seulement aux sites pirates et aux SmartTV : il aurait assigné Disney, l’un de…

Samsung Galaxy A57 : grâce à ces 2 offres cumulables, le smartphone passe à prix cassé !

Sorti il y a tout juste un mois, le Galaxy A57 est actuellement proposé à prix cassé sur le site officiel de Samsung. En effet, en cumulant le code MYPHONE…

Cette interdiction de Google censée lutter contre le piratage aurait eu l’effet totalement inverse

Google a interdit les publicités pour ebooks sur sa plateforme pour lutter contre le piratage. Mais selon des éditeurs qui le poursuivent en justice, seuls les vendeurs légaux auraient été…

Deux frères se font licencier, ils effacent les bases de données du gouvernement en à peine 5 minutes

Vous vous demandez pourquoi certaines entreprises suppriment les accès des employés avant de leur annoncer leur licenciement ? Cette histoire rocambolesque y répond parfaitement. Se faire licencier n’est jamais plaisant….

Amazon Fire TV Stick 4K Plus à -43% : le lecteur multimédia passe à petit prix !

Vous souhaitez connecter votre TV en un rien de temps ? Amazon propose actuellement son Fire TV Stick 4K Plus à 39,99€ au lieu de 69,99 €. C’est le bon moment pour…

Vous pouvez désormais concevoir n’importe quel widget Android grâce à cette idée de génie de Google

Les widgets Android sont souvent les mêmes pour tout le monde. Google vient d’annoncer une façon inédite d’en créer un qui vous ressemble vraiment. Une simple phrase suffit pour que…

Cette vidéo nous montre Aluminum OS, le nouveau concurrent de Windows basé sur Android

Aluminum OS, le système basé sur Android et successeur de Chrome OS, qui sera installé sur les nouveaux PC portables Googlebook, se montre dans une longue vidéo de 16 minutes….

PC

Le bouclier antimissile de Trump affiche une facture qui dépasse le PIB des Pays-Bas

Donald Trump veut couvrir les États-Unis d’un bouclier antimissile spatial. Un rapport officiel vient d’estimer sa facture réelle, et le chiffre est vertigineux. Ce projet divise déjà profondément, et sa…

Le prix du forfait mobile Série Free augmente, voici le nouveau tarif

Contre une dizaine de Go supplémentaires, Free augmente le prix de son forfait mobile 5G le plus abordable, qui devient plus cher que son équivalent chez RED by SFR. Free…

Le Steam Controller fait quelque chose de très innatendu quand il tombe (et c’est hilarant)

Un membre de Reddit a découvert un easter egg glissé par les équipes de Valve dans le Steam Controller. Si la manette tombe par mégarde, il est possible que celle-ci…