Gemini active enfin cette fonctionnalité que tout le monde attendait

Le déploiement de certaines fonctionnalités de Gemini se fait progressivement. Si les capacités de compréhension audio de l’IA de Google ont été réservées aux développeurs pendant un temps, les utilisateurs y ont enfin accès.

Gemini mémoire Google
Crédits : 123RF

Lorsqu’il s’agit d’IA, les géants de la tech optent régulièrement pour une approche prudente quant au déploiement des nouvelles fonctionnalités. Cela passe généralement par un déploiement progressif, parfois associé à des programmes d’accès anticipé. Le but ? En vérifier la qualité, la robustesse et la sécurité avant de les proposer à tous.

C’est notamment le cas de Google avec Gemini. L’an dernier, on vous annonçait que la firme de Mountain View avait doté son IA de capacités de compréhension audio, mais que cette fonctionnalité n’était disponible que via la plateforme de développement Vertex AI de Google et ses outils AI Studio. Cette restriction appartient dorénavant au passé, selon nos confrères de 9to5Google : tout le monde peut désormais téléverser des fichiers audio dans l’application Gemini.

Lire aussi – Google annonce les limitations de Gemini avec un compte gratuit

Gemini prend enfin en charge les fichiers audio

Josh Woodward, Vice-Président de Google Labs et responsable de Gemini, a annoncé sur X (ex-Twitter) que l’application sur le web, Android et iOS prend désormais en charge les fichiers audio. Il rappelle qu’il s’agissait de la demande numéro 1 des utilisateurs. Pour accéder à cette nouveauté :

  • Ouvrez l’application Gemini
  • Appuyez sur +
  • Sélectionnez Importer des fichiers (sur le web) ou Fichiers (sur mobile)
  • Choisissez n’importe quel fichier audio : Mp3, M4A, WAV…

Pour les utilisateurs gratuits, « la durée totale de l’audio peut atteindre 10 minutes » et 3 heures pour les abonnés Google AI Pro ou Google AI Ultra. Quant à la vidéo, elle peut peser jusqu’à 2 Go et durer jusqu’à 5 minutes maximum pour les membres gratuits, et jusqu’à 1 heure pour ceux payants. Parmi les autres nouveautés, Google indique également qu’il est possible de téléverser jusqu’à 10 fichiers dans la même invite, et que les fichiers ZIP peuvent aussi en contenir jusqu’à 10. Aussi, peuvent être ajoutés à une discussion un dossier de code ou un dépôt GitHub avec une taille maximale de 100 Mo et 5 000 fichiers maximum.

Il s’agit d’une étape importante qui permet de renforcer le caractère multimodal de Gemini, mais aussi d’élargir son utilité : l’IA peut désormais transcrire, résumer et analyser des fichiers audio comme des podcasts, des appels ou des conférences.


Réagissez à cet article !

Demandez nos derniers articles !

Google améliore enfin le Fitbit Air, les choses vont changer

Le bracelet connecté de Google, le Fitbit Air, s’améliore. La firme de Mountain View est en effet en train de déployer un important correctif, qui devrait largement améliorer l’expérience des…

Démarchage téléphonique : le Conseil constitutionnel censure la loi, voici ce qui va changer

Véritable fléau des temps modernes, le démarchage téléphonique pourrait bientôt revenir en masse. Suite à une action en justice d’Orange, le Conseil constitutionnel a en effet censuré plusieurs dispositions d’une…

Test Fiido T2 : Le vélo pour toute la famille sans se ruiner

Le constructeur Fiido ne pouvait passer à côté du segment des longtails, des vélos à assistance électrique pensés pour transporter confortablement et en toute sécurité les enfants. Voici le nouveau…

C’est la fin pour Aibo : Sony enterre son chien-robot emblématique

Le chien-robot ERS-1000 Aibo de Sony, c’est bientôt terminé. Le fabricant a en effet annoncé son intention de cesser de vendre l’adorable compagnon robotique dans son pays d’origine, le Japon….

PS6 portable : Sony lâche un énorme indice, elle pourrait débarquer plus tôt que prévu

Après la PS5 Pro, une PlayStation 6 portable pourrait bien devenir réalité. C’est en tout cas ce que semble suggérer le patron de Sony Interactive Entertainment, Hideaki Nishino, au cours…

La crise de la RAM menace l’iPhone 18, Apple pourrait sacrifier une partie d’iOS 27

La crise de la RAM pourrait faire une victime de plus. À cause de celle-ci, l’iPhone 18 d’Apple pourrait ainsi être privé de certaines fonctionnalités offertes par iOS 27. L’actuelle…

GTA 6 sur Switch 2 ? Rockstar prépare une énorme surprise, vous n’êtes pas prêts

Initialement disponible sur PS5 et Xbox Series X/S, le futur banger de Rockstar pourrait bien débarquer sur la console portable de Nintendo. Un leaker affirme en effet que GTA 6…

Appels indésirables incessants : cette solution efficace est proposée par NordVPN !

Tout le monde connaît NordVPN, le service VPN le plus avancé et le plus complet du marché. Mais cette solution pour sécuriser votre vie en ligne vient de dévoiler un…

Combien d’emplois ont été perdus à cause de l’IA ? Cet outil nous donne la réponse

Face aux inquiétudes concernant les conséquences de l’IA sur le marché du travail, la Californie a mis en ligne un outil de suivi des pertes d’emploi directement liées à cette…

The Frame 4K QLED (2026) de 55 pouces : à peine sortie, Samsung brade déjà son excellente TV pour les Soldes !

Les Soldes ont commencé sur Samsung et cette année encore, le géant coréen ne fait pas les choses à moitié. Sortie récemment, la nouvelle The Frame 4K QLED de 55…