Les nouvelles versions de ChatGPT sont de plus en plus puissantes… mais leur plus gros défaut empire aussi

Par Alexandre Mathiot Le 22/04/2025 0 com

OpenAI affirme avoir franchi un cap avec ses dernières intelligences artificielles. Pourtant, une étude révèle une faiblesse inattendue. Les modèles les plus récents produiraient encore plus d’erreurs que leurs prédécesseurs.

L'intelligence artificielle évolue rapidement, mais ses défauts persistent. OpenAI vient de publier des données sur ses nouveaux modèles o3 et o4-mini, censés être les plus performants à ce jour. Pourtant, ces IA présentent une hausse marquée des hallucinations. Ce phénomène désigne les erreurs graves où l’IA invente des faits, des études ou des liens. Un problème inquiétant car ces informations semblent crédibles pour les utilisateurs peu méfiants. Leur nombre reste un critère clé pour évaluer la fiabilité d'un modèle.

Les chiffres sont sans appel. OpenAI indique que o4-mini hallucine dans 48 % des cas testés avec l’outil interne PersonQA, soit trois fois plus que le modèle o1. Le modèle o3, pourtant plus grand et censé être plus fiable, produit également des erreurs dans 33 % des réponses, soit deux fois plus que le précédent. Cette évolution est surprenante car, en règle générale, chaque nouvelle génération de modèle tend à réduire ces problèmes. Ici, malgré des progrès sur l’exactitude globale, le risque d’obtenir de fausses informations augmente.

Les modèles o3 et o4-mini hallucinent davantage malgré leurs capacités de raisonnement accrues

OpenAI a conçu ses modèles récents pour externaliser leur raisonnement, affichant les étapes de réflexion pour plus de transparence. Cette approche, bien que prometteuse, n’empêche pas l’apparition d’informations erronées. Un rapport indépendant de Transluce a révélé que o3 invente parfois des capacités qu’il n’a pas, comme exécuter du code sur un MacBook Pro fictif. Pire, même face à une correction de l'utilisateur, ce dernier persiste dans son erreur. Cela remet en cause la fiabilité réelle de ces outils pourtant présentés comme plus rigoureux.

Les experts avancent plusieurs hypothèses pour expliquer ce phénomène. Des choix de conception, comme le renforcement basé sur les résultats, pourraient aggraver les hallucinations. De plus, OpenAI aurait réduit ses phases de tests de sécurité pour accélérer le développement de ses modèles. Cette stratégie, si elle permet d'innover plus vite, expose les utilisateurs à plus de contenus erronés. En attendant de meilleures solutions, la prudence reste indispensable : même les IA les plus avancées doivent être utilisées avec un regard critique.

ChatGPT

Abonnez-vous gratuitement à la newsletter

Réagissez à cet article !

Voir tous les commentaires

Demandez nos derniers articles !

Stranger Things saison 5 : la bande-annonce du dernier épisode dévoilée, voici ce qu’elle nous apprend
Le coup d’envoi est donné : le 1er janvier 2026 marquera la fin de Stranger Things, l’une des séries les plus populaires de la décennie. En attendant que l’ultime épisode soit diffusé, Netflix en dévoile la bande-annonce. Plus que quelques…

Netflix 30/12/2025
Test TECNO Megabook K15S : un PC portable puissant, fin et abordable !
Si TECNO est une marque d’ordinateurs portables récemment arrivée en France, elle mérite le détour par son catalogue riche en modèles. Malgré des prix agressifs, la marque ne fait aucun sacrifice sur le design et la qualité de fabrication. Le…

Tests 30/12/2025
Tesla Model 3 vs Ford Mustang Dark Horse : voici le vainqueur (le verdict final bouscule les pronostics)
Si on vous dit qu’une Tesla Model 3 Performance affronte une Ford Mustang Dark Horse dotée d’un compresseur, vous pourriez avoir tendance à miser sur la thermique plutôt que sur l’électrique. Une vidéo YouTube révèle les résultats de ce duel…

Voitures électriques 30/12/2025
Galaxy S26 et S26 Ultra : une vidéo dévoile le design final des futurs smartphones de Samsung
La prochaine gamme de smartphones Galaxy S26 devrait être officiellement présentée par Samsung en février 2026. Elle n’a pourtant déjà plus beaucoup de secrets pour les internautes qui s’y intéressent. Mais les leakers parviennent encore à nous surprendre : l’un…

Samsung 30/12/2025
La PS6 et la prochaine Xbox pourraient sortir plus tard que prévu pour éviter qu’elles coûtent un rein
On n’a pas encore fini parler de la crise de la RAM et cette fois, ce sont les constructeurs de consoles qui s’inquiètent des mois à venir. Un récent rapport indique en effet que la sortie de la PS6 et…

Consoles et hardware 30/12/2025
Avengers Doomsday : on sait quand le premier trailer sera diffusé, un peu de patience
Il semblerait que la date de diffusion de la première bande-Annonce d’Avengers : Doomsday ait fuité. Si la rumeur qui circule est exacte, nous ne sommes plus qu’à quelques semaines d’avoir enfin uyn vrai aperçu du film le plus attendu…

Streaming 30/12/2025
Tineco Floor One S5 Stretch Extreme : l’aspirateur laveur de sol chute à moins de 250 €, vite !
Et si vous commenciez l’année avec un intérieur propre comme par magie ? Avec le Tineco Floor One S5 Stretch Extreme, la corvée du nettoyage des sols est finie. Et bonne nouvelle, cet excellent aspirateur laveur va vous faciliter la…

Bons plans 30/12/2025
Dyson V15 Origin : vite, avec ces 250 € de réduction, cet excellent aspirateur sans fil devient abordable !
Le secteur des aspirateurs sans fil est énorme avec des différences de prix colossales entre les meilleurs modèles et ceux bas de gamme. Si vous voulez acheter l’un des meilleurs aspirateurs sans fil sans vous ruiner, nous avons trouvé une…

Bons plans 30/12/2025
Samsung prépare une batterie titanesque pour ses smartphones Galaxy, mais il y a un sérieux problème
Samsung est régulièrement critiqué pour la capacité de ses batteries bien en-deçà des performances offertes par les fabricants de smartphones chinois. Qu’à cela ne tienne, la firme sud-coréenne développerait une batterie à double cellule impressionnante. L’un des principaux critères sur…

Samsung 30/12/2025
Le Samsung Galaxy A07 5G arrive bientôt, une fuite révèle tout
Samsung ne devrait pas tarder à lancer sur le marché la version 5G de son Galaxy A07. Un listing est en effet apparu et a permis d’en apprendre plus sur le smartphone entrée de gamme. Résumé des spécifications techniques que…

Samsung Galaxy A 30/12/2025

Newsletter