Les nouvelles versions de ChatGPT sont de plus en plus puissantes… mais leur plus gros défaut empire aussi

OpenAI affirme avoir franchi un cap avec ses dernières intelligences artificielles. Pourtant, une étude révèle une faiblesse inattendue. Les modèles les plus récents produiraient encore plus d’erreurs que leurs prédécesseurs.

ChatGPT nouvelle voix
Crédits : 123RF

L'intelligence artificielle évolue rapidement, mais ses défauts persistent. OpenAI vient de publier des données sur ses nouveaux modèles o3 et o4-mini, censés être les plus performants à ce jour. Pourtant, ces IA présentent une hausse marquée des hallucinations. Ce phénomène désigne les erreurs graves où l’IA invente des faits, des études ou des liens. Un problème inquiétant car ces informations semblent crédibles pour les utilisateurs peu méfiants. Leur nombre reste un critère clé pour évaluer la fiabilité d'un modèle.

Les chiffres sont sans appel. OpenAI indique que o4-mini hallucine dans 48 % des cas testés avec l’outil interne PersonQA, soit trois fois plus que le modèle o1. Le modèle o3, pourtant plus grand et censé être plus fiable, produit également des erreurs dans 33 % des réponses, soit deux fois plus que le précédent. Cette évolution est surprenante car, en règle générale, chaque nouvelle génération de modèle tend à réduire ces problèmes. Ici, malgré des progrès sur l’exactitude globale, le risque d’obtenir de fausses informations augmente.

Les modèles o3 et o4-mini hallucinent davantage malgré leurs capacités de raisonnement accrues

OpenAI a conçu ses modèles récents pour externaliser leur raisonnement, affichant les étapes de réflexion pour plus de transparence. Cette approche, bien que prometteuse, n’empêche pas l’apparition d’informations erronées. Un rapport indépendant de Transluce a révélé que o3 invente parfois des capacités qu’il n’a pas, comme exécuter du code sur un MacBook Pro fictif. Pire, même face à une correction de l'utilisateur, ce dernier persiste dans son erreur. Cela remet en cause la fiabilité réelle de ces outils pourtant présentés comme plus rigoureux.

Les experts avancent plusieurs hypothèses pour expliquer ce phénomène. Des choix de conception, comme le renforcement basé sur les résultats, pourraient aggraver les hallucinations. De plus, OpenAI aurait réduit ses phases de tests de sécurité pour accélérer le développement de ses modèles. Cette stratégie, si elle permet d'innover plus vite, expose les utilisateurs à plus de contenus erronés. En attendant de meilleures solutions, la prudence reste indispensable : même les IA les plus avancées doivent être utilisées avec un regard critique.


Réagissez à cet article !

Demandez nos derniers articles !

Test Zero Parades For Dead Spies : incroyable mais bon

Impossible pour quiconque ayant déjà joué à Disco Elysium de ne pas se lancer dans Zero Parades : For Dead Spies, le nouveau jeu de ZA/UM, avec une certaine appréhension….

YouTube : vous n’avez pas encore l’icône de sa nouvelle messagerie directe ? Voici l’astuce pour y accéder quand même

Après une phase de test limitée à certaines régions, YouTube étend désormais sa fonctionnalité de messagerie directe à de nouveaux pays, dont la France. L’objectif ? Que les utilisateurs puissent…

Halo 1 Remake : surprise, vous allez pouvoir jouer Master Chief à la troisième personne

Xbox a révélé une vidéo de gameplay à la troisième personne pour son jeu Halo Campaign Evolved, le remake du premier opus de la saga. La licence Halo est un…

Vous ne voulez rien manquer de la Coupe du Monde ? Voici comment voir tous les matchs

C’est parti pour la Coupe du Monde de football 2026, et pour la première fois depuis près de 50 ans, TF1 ne fait pas partie des diffuseurs en France. Les…

L’Arcom va bloquer les IPTV pendant la Coupe du Monde : les utilisateurs risquent “un écran noir au moment d’un penalty”

L’Arcom annonce le déploiement d’un nouveau dispositif de blocage en temps réel des services IPTV en France pour la Coupe du monde de football. “Un écran noir au moment d’un…

Êtes-vous prêt à laisser ChatGPT payer avec votre carte Visa ? OpenAI vient de signer un accord inattendu

OpenAI veut transformer ChatGPT en véritable assistant d’achat. Pour y parvenir, l’entreprise vient de nouer une alliance stratégique avec Visa. Le géant du paiement ouvre la voie à des transactions…

IA

Google déploie la bêta 4 d’Android 17 QPR1, on se rapproche d’une version finale

La quatrième bêta d’Android 17 QPR1 est disponible. Cette version se concentre sur les correctifs de bugs plutôt que sur les nouveautés, indiquant que la version stable n’est plus très…

D’étranges points rouges apparaissent depuis 3 ans dans l’espace, leur secret vient enfin d’être percé

Depuis trois ans, de minuscules taches rouges captées par le télescope James Webb résistent à toutes les explications. Une équipe d’astronomes vient d’en analyser une avec une précision inédite. Ce…

La suite de The Social Network dévoile enfin sa bande-annonce et promet un thriller glaçant

Seize ans après The Social Network, le scénariste du film culte fait son grand retour. Sa nouvelle œuvre s’attaque à l’un des scandales les plus retentissants de Facebook. La première…

Les cartes-cadeaux Steam en magasin, c’est terminé : Valve y met fin

Valve a pris la décision d’arrêter la commercialisation des cartes-cadeaux Steam physiques. Pourquoi l’entreprise en arrive-t-elle là ? L’explication est simple, bien qu’affligeante. C’est la fin d’une aventure de 14…