Gemini active enfin cette fonctionnalité que tout le monde attendait

Le déploiement de certaines fonctionnalités de Gemini se fait progressivement. Si les capacités de compréhension audio de l’IA de Google ont été réservées aux développeurs pendant un temps, les utilisateurs y ont enfin accès.

Gemini mémoire Google
Crédits : 123RF

Lorsqu’il s’agit d’IA, les géants de la tech optent régulièrement pour une approche prudente quant au déploiement des nouvelles fonctionnalités. Cela passe généralement par un déploiement progressif, parfois associé à des programmes d’accès anticipé. Le but ? En vérifier la qualité, la robustesse et la sécurité avant de les proposer à tous.

C’est notamment le cas de Google avec Gemini. L’an dernier, on vous annonçait que la firme de Mountain View avait doté son IA de capacités de compréhension audio, mais que cette fonctionnalité n’était disponible que via la plateforme de développement Vertex AI de Google et ses outils AI Studio. Cette restriction appartient dorénavant au passé, selon nos confrères de 9to5Google : tout le monde peut désormais téléverser des fichiers audio dans l’application Gemini.

Lire aussi – Google annonce les limitations de Gemini avec un compte gratuit

Gemini prend enfin en charge les fichiers audio

Josh Woodward, Vice-Président de Google Labs et responsable de Gemini, a annoncé sur X (ex-Twitter) que l’application sur le web, Android et iOS prend désormais en charge les fichiers audio. Il rappelle qu’il s’agissait de la demande numéro 1 des utilisateurs. Pour accéder à cette nouveauté :

  • Ouvrez l’application Gemini
  • Appuyez sur +
  • Sélectionnez Importer des fichiers (sur le web) ou Fichiers (sur mobile)
  • Choisissez n’importe quel fichier audio : Mp3, M4A, WAV…

Pour les utilisateurs gratuits, « la durée totale de l’audio peut atteindre 10 minutes » et 3 heures pour les abonnés Google AI Pro ou Google AI Ultra. Quant à la vidéo, elle peut peser jusqu’à 2 Go et durer jusqu’à 5 minutes maximum pour les membres gratuits, et jusqu’à 1 heure pour ceux payants. Parmi les autres nouveautés, Google indique également qu’il est possible de téléverser jusqu’à 10 fichiers dans la même invite, et que les fichiers ZIP peuvent aussi en contenir jusqu’à 10. Aussi, peuvent être ajoutés à une discussion un dossier de code ou un dépôt GitHub avec une taille maximale de 100 Mo et 5 000 fichiers maximum.

Il s’agit d’une étape importante qui permet de renforcer le caractère multimodal de Gemini, mais aussi d’élargir son utilité : l’IA peut désormais transcrire, résumer et analyser des fichiers audio comme des podcasts, des appels ou des conférences.


Réagissez à cet article !

Demandez nos derniers articles !

Prime Day Roborock : remises jusqu’à 1 000 € sur quatre robots aspirateurs et un balai vapeur révolutionnaire

C’est enfin le Prime Day. Roborock dégaine cinq aspirateurs robots avec remises jusqu’à 1 000 €. Du Saros 20 ultra-autonome au F25 Ultra vapeur, on décrypte les vraies différences tech…

Avec sa réduction de bruit redoutable, le Sony WH-1000XM5 passe à moins de 195 €

Toujours considéré comme l’une des références du marché, le Sony WH-1000XM5 voit son prix chuter à moins de 200 €, soit moins de la moitié de son prix de lancement. C’est…

Argentine Algérie : voici les options pour suivre le match de Coupe du monde en direct

Pour son entrée en lice en Coupe du monde, l’Algérie affronte l’Argentine. Le tirage au sort n’a pas fait de cadeau aux Fennecs : dès le premier match, c’est l’Argentine…

iOS 27 : calendrier de sortie, iPhone compatibles, tout ce que l’on sait de la future mise à jour majeure d’Apple

iOS 27 est la prochaine version majeure du système d’exploitation d’Apple. Cette mise à jour est annoncée comme celle qui permettra enfin à la marque à la pomme d’entrer vraiment…

Hallucination au tribunal : un procès suspendu, des avocats condamnés pour avoir choisi l’IA comme associé

Cette affaire pourrait porter le titre d’« Arroseur arrosé ». Lors d’un procès, ce sont finalement les avocats des deux parties qui se sont retrouvés condamnés… pour avoir utiliser l’IA dans leurs…

Android 17 : mon smartphone Samsung pourra-t-il installer la prochaine grosse mise à jour ?

Après l’annonce en grande pompe d’Android 17, beaucoup se demandent désormais si leur smartphone sera compatible avec la mise à jour. Bonne nouvelle, nous avons déjà la liste des appareils…

Nouvelle hausse de prix pour le forfait mobile Série Free, est-il encore si intéressant ?

Le forfait mobile Série Free voit encore son prix augmenter, seulement quelques semaines après une autre hausse. De quoi relativiser son intérêt. Il y a un mois, Free Mobile augmentait…

DJI Neo 2 : le mini drone pour débutant capable de filmer en 4K est à moins de 165 €, vite !

Vous rêvez de faire des vidéos et des photos en drone mais vous ne savez absolument pas piloter ? Aucun souci, la marque DJI a pensé à vous en créant…

Xiaomi TV Box S 3ème génération : donnez un coup de boost à votre TV pour moins de 50 euros

La Xiaomi TV Box S de 3ème génération est la solution idéale pour redonner toute sa jeunesse à votre vieux téléviseur. Il suffit de la brancher à un port HDMI…

Facebook lance son mode IA, à quoi ça sert et comment ça marche ?

Meta annonce le lancement d’un mode IA pour Facebook, qui se veut un moteur de recherche basé sur Meta AI pour obtenir des réponses basées sur le contenu publié sur…