Google rend Gemini 3.1 Pro deux fois plus intelligent, au prix de son humanité ?

Google déploie une nouvelle version de son intelligence artificielle. Gemini 3.1 Pro promet des performances bien supérieures en raisonnement. Mais certains utilisateurs estiment que l’IA semble désormais moins humaine.

Gemini
Crédits : 123RF

Google accélère fortement sur l’intelligence artificielle depuis le début de l’année. Gemini évolue à un rythme soutenu et gagne régulièrement de nouvelles fonctions. Après la génération d’images et de vidéos, l’assistant peut désormais créer de la musique grâce au modèle Lyria 3. Il suffit de décrire une idée ou d’importer une image pour obtenir un morceau de 30 secondes avec paroles et instrumental. En parallèle, l’intégration avec Google Maps progresse aussi. Les utilisateurs peuvent sélectionner une zone géographique et demander à l’IA des recommandations précises.

Cette multiplication des usages s’accompagne d’améliorations techniques du modèle lui-même. Google vient ainsi de lancer Gemini 3.1 Pro en version preview. La mise à jour est déployée sur l’ensemble des formules, y compris la version gratuite. Elle est aussi disponible dans NotebookLM, l’outil de l'entreprise qui aide à analyser des documents et à résumer des contenus complexes. Avec cette nouvelle version, l’entreprise veut rendre son IA plus performante pour résoudre des tâches difficiles, notamment en logique et en programmation.

Gemini 3.1 Pro devient bien plus performant en logique, mais change de personnalité

Gemini 3.1 Pro affiche une progression importante sur le test ARC-AGI-2. Ce benchmark mesure la capacité d’une intelligence artificielle à comprendre et résoudre des problèmes logiques totalement nouveaux. Le modèle doit identifier des motifs et appliquer des règles sans exemple préalable. Sur cette épreuve, la version 3.1 Pro atteint un score de 77,1 %. La précédente, Gemini 3 Pro, obtenait un résultat plus de deux fois inférieur. Cette différence illustre un net gain en raisonnement.

Google a présenté une démonstration de planification urbaine pour illustrer ces progrès. Le modèle analyse un terrain, organise les infrastructures et simule la circulation afin de produire une visualisation détaillée. Malgré ces avancées, certains utilisateurs expriment des réserves. Sur les réseaux sociaux, plusieurs estiment que les réponses paraissent plus analytiques et moins nuancées qu’auparavant. Ils évoquent une baisse d’empathie et de créativité. La firme rappelle toutefois qu’il s’agit d’une version provisoire appelée à évoluer avec de prochaines mises à jour.


Abonnez-vous gratuitement à la newsletter

Chaque jour, le meilleur de Phonandroid dans votre boite mail !

Réagissez à cet article !

Demandez nos derniers articles !

Vous pouvez enfin enregistrer vos appels sur votre Pixel, Google a activé l’option en France

L’option d’enregistrement des appels des smartphones Pixel de Google est désormais disponible en France, après des mois d’attente.  C’est en 2021 que Google a lancé pour la première fois sa…

Honor déploie la mise à jour MagicOS 10, voici les nouveautés qui arrivent sur votre smartphone

La mise à jour MagicOS 10 est disponible, avec une interface remaniée et de nouvelles fonctionnalités. Voici ce qu’on en retient. Il y a quelques mois, Honor lançait MagicOS 10…

Piégés par une avalanche mortelle, un iPhone leur sauve la vie

La fonction d’appel d’urgence par satellite de l’iPhone a sauvé la vie de plusieurs skieurs en danger après avoir été surpris par une avalanche. Ce n’est pas la première fois…

Pixel 11 : Google pourrait faire de son prochain smartphone un bunker de sécurité matérielle

Le Pixel 10a étant officiel, le feu des projecteurs se braque désormais sur le futur smartphone de Google ne l’étant pas encore : le Pixel 11. D’après la dernière rumeur…

AMD bat le record du monde de l’overclocking avec une fréquence complètement folle atteinte par la Radeon RX 9060 XT

AMD vient de publier une vidéo sur sa chaîne YouTube qui suit le record d’overclocking établi sur sa Radeon RX 9060 XT. La fréquence obtenue par les deux participants dépasse…

Le airfryer Ninja Double Stack 7,6 L passe à prix sacrifié avec 100 € de réduction !

Normalement en vente à 229,99 €, le airfryer Ninja Double Stack d’une capacité de 7,6 L est actuellement en promotion sur le site officiel de la marque. Et avec le…

On sait quels processeurs équiperont les Nothing Phone (4a), la marque confirme

Nothing tease encore l’arrivée imminente des Nothing Phone (4a) et (4a) Pro en annonçant les processeurs qu’embarqueront les smartphones. On sait désormais quasiment tout sur les deux mobiles. Nothing met…

WhatsApp a trouvé la solution pour que vous compreniez enfin ce qu’il se passe quand vous débarquez dans une conversation de groupe

Il est parfois bien compliqué de prendre une conversation en route lorsque l’on arrive dans un groupe WhatsApp. L’application de messagerie s’attaque enfin à ce problème avec une nouvelle fonctionnalité…

La ville privée de SpaceX construit son propre tribunal, Elon Musk bientôt juge ?

Starbase continue de s’organiser comme une véritable ville. Après les pompiers et un futur service de police, elle veut désormais sa propre justice. La cité fondée autour de SpaceX franchit…

Votre casque audio contient des substances toxiques, cette étude fait froid dans le dos

Une analyse menée sur plus de 80 modèles de casques audio montrent que ces derniers contiennent des composés chimiques nuisibles à l’Homme. Lesquels et peut-on agir à notre niveau ?…