Gemini active enfin cette fonctionnalité que tout le monde attendait

Le déploiement de certaines fonctionnalités de Gemini se fait progressivement. Si les capacités de compréhension audio de l’IA de Google ont été réservées aux développeurs pendant un temps, les utilisateurs y ont enfin accès.

Gemini mémoire Google
Crédits : 123RF

Lorsqu’il s’agit d’IA, les géants de la tech optent régulièrement pour une approche prudente quant au déploiement des nouvelles fonctionnalités. Cela passe généralement par un déploiement progressif, parfois associé à des programmes d’accès anticipé. Le but ? En vérifier la qualité, la robustesse et la sécurité avant de les proposer à tous.

C’est notamment le cas de Google avec Gemini. L’an dernier, on vous annonçait que la firme de Mountain View avait doté son IA de capacités de compréhension audio, mais que cette fonctionnalité n’était disponible que via la plateforme de développement Vertex AI de Google et ses outils AI Studio. Cette restriction appartient dorénavant au passé, selon nos confrères de 9to5Google : tout le monde peut désormais téléverser des fichiers audio dans l’application Gemini.

Lire aussi – Google annonce les limitations de Gemini avec un compte gratuit

Gemini prend enfin en charge les fichiers audio

Josh Woodward, Vice-Président de Google Labs et responsable de Gemini, a annoncé sur X (ex-Twitter) que l’application sur le web, Android et iOS prend désormais en charge les fichiers audio. Il rappelle qu’il s’agissait de la demande numéro 1 des utilisateurs. Pour accéder à cette nouveauté :

  • Ouvrez l’application Gemini
  • Appuyez sur +
  • Sélectionnez Importer des fichiers (sur le web) ou Fichiers (sur mobile)
  • Choisissez n’importe quel fichier audio : Mp3, M4A, WAV…

Pour les utilisateurs gratuits, « la durée totale de l’audio peut atteindre 10 minutes » et 3 heures pour les abonnés Google AI Pro ou Google AI Ultra. Quant à la vidéo, elle peut peser jusqu’à 2 Go et durer jusqu’à 5 minutes maximum pour les membres gratuits, et jusqu’à 1 heure pour ceux payants. Parmi les autres nouveautés, Google indique également qu’il est possible de téléverser jusqu’à 10 fichiers dans la même invite, et que les fichiers ZIP peuvent aussi en contenir jusqu’à 10. Aussi, peuvent être ajoutés à une discussion un dossier de code ou un dépôt GitHub avec une taille maximale de 100 Mo et 5 000 fichiers maximum.

Il s’agit d’une étape importante qui permet de renforcer le caractère multimodal de Gemini, mais aussi d’élargir son utilité : l’IA peut désormais transcrire, résumer et analyser des fichiers audio comme des podcasts, des appels ou des conférences.


Réagissez à cet article !

Demandez nos derniers articles !

Cette éruption solaire vient de couper les communications radio et pourrait offrir des aurores boréales

Le Soleil vient de lâcher une puissante éruption, accompagnée d’un nuage de plasma en route vers la Terre. Le choc pourrait survenir dès cette nuit. Des aurores boréales sont attendues…

Quelle est votre première chanson et votre artiste le plus écouté sur Spotify ? Voici comment le savoir

Pour célébrer ses 20 ans, Spotify lance un outil de type Wrapped, mais qui fait le bilan de votre présence sur la plateforme depuis vos débuts plutôt que de la…

Dreamina AI : la génération de vidéos ultra-réalistes est restreinte en France, voici pourquoi et comment la débloquer

ByteDance propose l’un des générateurs vidéo IA les plus impressionnants du moment, mais l’accès est volontairement bridé en France et dans l’UE. Voici comment en profiter plus confortablement pour en…

Free active l’option eSIM pour les Samsung Galaxy Watch, et c’est gratuit !

Les abonnés Free Mobile peuvent désormais accéder gratuitement à l’eSIM sur leur montre connectée Samsung Galaxy Watch. Les Google Pixel Watch seront bientôt prises en charge également. En décembre dernier,…

One UI 9 : la bêta est enfin ouverte au public, votre smartphone est-il éligible ?

Quelques heures après que la rumeur s’est diffusée dans le monde entier, Samsung a fini par lâcher le morceau : la première bêta publique de One UI 9 sera disponible…

JBL rend officielle la série JBL Live 4 : des écouteurs conçus pour une expérience complète et sur mesure encore plus fluide

JBL a officialisé sa nouvelle série d’écouteurs avec boîtier Smart Charging Case : la gamme JBL Live 4. Caractéristiques principales, prix, nouveautés… Voici ce qu’il faut retenir des trois modèles qui…

Les JBL Live 680NC et 780NC sont officiels : ces casques pensés pour le quotidien allient style, confort et qualité audio

JBL officialise sa nouvelle gamme de casques Live : les JBL Live 680NC et 780NC. La marque a fait évoluer plusieurs aspects afin de proposer des produits pensés pour le quotidien,…

JBL officialise le EasySing Mic Mini : faites entendre votre voix partout grâce à ce micro nomade dopé à l’IA

JBL vient de présenter plusieurs produits. Aux côtés des nouvelles générations de casques, écouteurs et PartyBox, un appareil fait figure de nouveauté totale : le EasySing Mic Mini, un micro de…

JBL officialise les enceintes PartyBox 130 et 330 ou comment faire la fête intensément jusqu’au bout de la nuit

En même temps que ses nouvelles séries de casques, d’écouteurs et d’un produit inédit, JBL vient d’officialiser la dernière génération de ses enceintes festives, composée des PartyBox 130 et PartyBox…

Voiture électrique : Lexus rattrape enfin Tesla en ajoutant cette option fondamentale

Il était temps que les voitures électriques Lexus se mettent au niveau de la concurrence. Surtout au niveau d’une fonction très utilisée ailleurs depuis des années et totalement absente des…