Gemini active enfin cette fonctionnalité que tout le monde attendait

Le déploiement de certaines fonctionnalités de Gemini se fait progressivement. Si les capacités de compréhension audio de l’IA de Google ont été réservées aux développeurs pendant un temps, les utilisateurs y ont enfin accès.

Gemini mémoire Google
Crédits : 123RF

Lorsqu’il s’agit d’IA, les géants de la tech optent régulièrement pour une approche prudente quant au déploiement des nouvelles fonctionnalités. Cela passe généralement par un déploiement progressif, parfois associé à des programmes d’accès anticipé. Le but ? En vérifier la qualité, la robustesse et la sécurité avant de les proposer à tous.

C’est notamment le cas de Google avec Gemini. L’an dernier, on vous annonçait que la firme de Mountain View avait doté son IA de capacités de compréhension audio, mais que cette fonctionnalité n’était disponible que via la plateforme de développement Vertex AI de Google et ses outils AI Studio. Cette restriction appartient dorénavant au passé, selon nos confrères de 9to5Google : tout le monde peut désormais téléverser des fichiers audio dans l’application Gemini.

Lire aussi – Google annonce les limitations de Gemini avec un compte gratuit

Gemini prend enfin en charge les fichiers audio

Josh Woodward, Vice-Président de Google Labs et responsable de Gemini, a annoncé sur X (ex-Twitter) que l’application sur le web, Android et iOS prend désormais en charge les fichiers audio. Il rappelle qu’il s’agissait de la demande numéro 1 des utilisateurs. Pour accéder à cette nouveauté :

  • Ouvrez l’application Gemini
  • Appuyez sur +
  • Sélectionnez Importer des fichiers (sur le web) ou Fichiers (sur mobile)
  • Choisissez n’importe quel fichier audio : Mp3, M4A, WAV…

Pour les utilisateurs gratuits, « la durée totale de l’audio peut atteindre 10 minutes » et 3 heures pour les abonnés Google AI Pro ou Google AI Ultra. Quant à la vidéo, elle peut peser jusqu’à 2 Go et durer jusqu’à 5 minutes maximum pour les membres gratuits, et jusqu’à 1 heure pour ceux payants. Parmi les autres nouveautés, Google indique également qu’il est possible de téléverser jusqu’à 10 fichiers dans la même invite, et que les fichiers ZIP peuvent aussi en contenir jusqu’à 10. Aussi, peuvent être ajoutés à une discussion un dossier de code ou un dépôt GitHub avec une taille maximale de 100 Mo et 5 000 fichiers maximum.

Il s’agit d’une étape importante qui permet de renforcer le caractère multimodal de Gemini, mais aussi d’élargir son utilité : l’IA peut désormais transcrire, résumer et analyser des fichiers audio comme des podcasts, des appels ou des conférences.


Réagissez à cet article !

Demandez nos derniers articles !

Vous pouvez générer des chansons de 3 minutes par IA avec Gemini et Lyria 3 Pro

Google lance Lyria 3 Pro, son nouveau modèle d’IA de génération de musique. Il est capable de créer des chansons de plus longue durée que les versions précédentes, et est…

Chrome sur Android est “la plateforme mobile la plus rapide pour la navigation web”, déclare Google

Les performances d’Android en matière de navigation web ont atteint des niveaux record. Les smartphones haut de gamme avec Chrome sont devenus plus rapides que les iPhone. La rapidité de…

Apple Plans va intégrer de la publicité, c’est officiel

Apple confirme ouvrir son application Plans à la publicité. Les entreprises et restaurants pourront payer pour être mis en avant par la plateforme, comme sur Google Maps. Les rumeurs de…

Windows 11 : travaillez plus vite grâce à ces 5 outils bien cachés dans le système d’exploitation

Envie de travailler plus vite sur votre PC ? Bonne nouvelle, puisque Windows 11 embarque de nombreuses fonctionnalités méconnues pour vous aider à booster votre productivité. Faisons ensemble les présentations….

Tineco Floor One S6 Stretch Lite : plus de 67% de réduction sur cet aspirateur eau et poussière, vite !

À l’occasion de l’anniversaire AliExpress, vous pouvez vous offrir l’aspirateur sec et humide Tineco Floor One S6 Stretch Lite pour moins de 165 euros grâce au code FRASPHD20. Mais attention,…

YouTube supprime le compteur de J’aime et ça ne plaît pas à tout le monde

Après avoir supprimé le compteur de Je n’aime pas il y a quelques années, YouTube semble envisager de retirer également celui des J’aime. Au plus grand dam de certains utilisateurs….

Le nouveau Ninja CRISPi PRO est enfin là, et pour fêter la sortie du airfryer, la marque vous offre un cadeau !

La famille des friteuses sans huile du géant américain s’agrandit avec un nouveau modèle : le Ninja CRISPi PRO. Ce airfryer polyvalent dispose d’un contenant en verre plus grand tout…

Avec les Bravia 2 II et Bravia 3 II, Sony démontre qu’il sait faire des TV abordables

Alors que plusieurs concurrents s’apprêtent à lancer des modèles RGB LED, Sony prend à contrepied le marché en présentant deux TV abordables : les Bravia 2 II et Bravia 3…

TV

L’application Gemini sur Android va changer du tout au tout, à quoi faut-il s’attendre ?

Google travaille sur une refonte de l’application Gemini sur Android. Plusieurs modifications d’interface vont être opérées, et on sait déjà lesquelles. L’interface de l’application Gemini sur Android ne va bientôt…

IA

iOS 27 : bouton « Ask Siri », application dédiée… voici le plan d’Apple pour enfin réinventer Siri

Siri : ce nom est synonyme de déceptions pour certains et d’espoirs pour d’autres. Attendue pour iOS 26.4, la nouvelle version de l’assistant d’Apple n’a toujours pas pointé le bout de…