L’IA Gemini de Google peut désormais écouter des fichiers audio pour vous aider

Quelques semaines seulement après avoir dévoilé son nouveau modèle d'IA phare, Gemini, destiné à concurrencer le ChatGPT d'OpenAI, Google a déjà donné un coup de fouet à cette technologie en la dotant de capacités de compréhension audio.

Selon un rapport d'Android Headlines, la dernière version 1.5 Pro de Gemini peut désormais ingérer, traiter et comprendre les données audio au-delà du texte et des images. Cette étape importante permet à Gemini de transcrire, de résumer et d'analyser des fichiers audio tels que des podcasts, des conférences, des appels à bénéfices et plus encore, directement à partir de la source audio d'origine.

Dans le contexte actuel, la plupart des outils de transcription et de résumé de l'IA s'appuient sur la conversion de l'audio en texte avant d'analyser le contenu. Mais Gemini 1.5 Pro supprime cette étape intermédiaire en comprenant l'audio à un niveau plus profond, ce qui peut améliorer la précision des réponses.

Lire également – Gemini : après Messages, l’IA de Google débarque dans cette application de la firme

Gemini peut comprendre votre voix, ou d’autres fichiers audio

Les compétences audio améliorées élargissent considérablement l'utilité de Gemini dans toute une série de cas d'utilisation professionnelle et créative. Imaginez que vous puissiez télécharger l'enregistrement d'une réunion d'entreprise de trois heures et recevoir en quelques secondes un résumé concis des points clés et des actions à entreprendre, généré par l'IA.

Les podcasters et les créateurs audio pourraient utiliser Gemini pour l'analyse thématique, les notes de préparation d'émissions et même la création de contenu audio assistée par la compréhension de l'IA. Les possibilités sont pratiquement infinies lorsque l'audio rejoint le texte et les images dans le répertoire de Gemini. Il s'agit d'un élément essentiel de la feuille de route de Google visant à faire de son modèle d'IA phare un véritable assistant multimodal capable de traiter n'importe quel type de données. D’ailleurs, Google a récemment noué un partenariat avec un géant de la publicité, donc cette nouvelle fonctionnalité pourrait bien l’aider à créer de nouvelles annonces.

Google semble adopter une approche prudente et contrôlée dans un premier temps. Pour l'instant, les nouvelles compétences audio de Gemini ne seront disponibles que via la plateforme de développement Vertex AI de Google et ses outils AI Studio, et non via le service disponible pour les consommateurs. Il s'agit d'une mesure prudente qui permettra à Google de valider rigoureusement la qualité et la robustesse des capacités audio de Gemini avant de les proposer à tous.


Réagissez à cet article !

Demandez nos derniers articles !

Quelqu’un usurpe le nom de la FIFA pour faire disparaître des sites pirates de Google

Quelqu’un bombarde Google de plaintes générées par IA pendant le Mondial. Toutes réclament le déréférencement total de dizaines de sites pirates. Elles arborent le nom de la FIFA, qui n’y…

Soldes d’été NordVPN : c’est le bon moment pour sécuriser vos données à prix cassé

Les soldes d’été débarquent en force chez NordVPN ! Du 24 juin au 21 juillet inclus, le leader de la cybersécurité casse ses prix sur ses abonnements. L’occasion rêvée pour…

Cette Tesla Model 3 maltraitée pendant deux ans révèle une vérité inattendue sur les batteries des VE

Les batteries de voitures électriques font peur, surtout sur les véhicules d’occasion malmenés. Une Tesla Model 3 ex-location avait perdu 20 % de capacité en à peine deux ans. Ce…

Deezer lance Remix, une fonctionnalité pour créer vos propres version de vos morceaux préférés… ou presque

Deezer vient d’annoncer une nouvelle fonctionnalité tout droit inspirée de ce que propose déjà TikTok depuis plusieurs années. Baptisée Remix, celle-ci laisse la main à l’utilisateur pour modifier différents éléments…

Prime Day : les montres connectées et écouteurs Huawei sont à prix mini sur Amazon

Pour ce deuxième jour du Prime Day, nous avons trouvé pour vous de superbes offres Huawei sur Amazon. Si vous avez un budget limité pour vous équiper, nous vous conseillons…

Google Messages vous laissera discuter avec Google Messages, mais pour quoi faire ?

Google travaille sur un nouveau genre d’assistant intégré à Google Messages. Il s’agirait de parler à l’application elle-même. Non, ce n’est pas destiné aux personnes qui se sentent seules. Il…

Google Home Speaker : il se procure une enceinte en avance et révèle son plus gros défaut (et ses qualités audio)

Alors que la nouvelle enceinte Google Home Speaker est disponible à la précommande, un internaute a réussi à s’en procurer une en avance. Il a livré ses premières impressions et…

Ne vous précipitez pas sur l’iPhone Ultra, cette étude sur sa dépréciation va vous refroidir

L’iPhone Ultra s’annonce comme le smartphone le plus cher jamais vendu par Apple. Mais acheter ce pliable dès sa sortie pourrait se révéler très coûteux. Une étude sur la dépréciation…

La Galaxy Watch Ultra 2 de Samsung sera un clone de la première, la preuve

Quelques semaines avant sa présentation officielle, de nouveaux rendus montrent à quel point la Samsung Galaxy Watch Ultra 2 ressemble à la précédente. Il y aurait quand même un changement…

Comment les Samsung Galaxy Watch vont accélérer la recherche médicale

Et si porter une Galaxy Watch servait à aider la recherche médicale ? Voilà le postulat de Samsung, qui annonce un partenariat dédié à l’avancée des études cliniques et du…