Les nouvelles versions de ChatGPT sont de plus en plus puissantes… mais leur plus gros défaut empire aussi

OpenAI affirme avoir franchi un cap avec ses dernières intelligences artificielles. Pourtant, une étude révèle une faiblesse inattendue. Les modèles les plus récents produiraient encore plus d’erreurs que leurs prédécesseurs.

ChatGPT nouvelle voix
Crédits : 123RF

L'intelligence artificielle évolue rapidement, mais ses défauts persistent. OpenAI vient de publier des données sur ses nouveaux modèles o3 et o4-mini, censés être les plus performants à ce jour. Pourtant, ces IA présentent une hausse marquée des hallucinations. Ce phénomène désigne les erreurs graves où l’IA invente des faits, des études ou des liens. Un problème inquiétant car ces informations semblent crédibles pour les utilisateurs peu méfiants. Leur nombre reste un critère clé pour évaluer la fiabilité d'un modèle.

Les chiffres sont sans appel. OpenAI indique que o4-mini hallucine dans 48 % des cas testés avec l’outil interne PersonQA, soit trois fois plus que le modèle o1. Le modèle o3, pourtant plus grand et censé être plus fiable, produit également des erreurs dans 33 % des réponses, soit deux fois plus que le précédent. Cette évolution est surprenante car, en règle générale, chaque nouvelle génération de modèle tend à réduire ces problèmes. Ici, malgré des progrès sur l’exactitude globale, le risque d’obtenir de fausses informations augmente.

Les modèles o3 et o4-mini hallucinent davantage malgré leurs capacités de raisonnement accrues

OpenAI a conçu ses modèles récents pour externaliser leur raisonnement, affichant les étapes de réflexion pour plus de transparence. Cette approche, bien que prometteuse, n’empêche pas l’apparition d’informations erronées. Un rapport indépendant de Transluce a révélé que o3 invente parfois des capacités qu’il n’a pas, comme exécuter du code sur un MacBook Pro fictif. Pire, même face à une correction de l'utilisateur, ce dernier persiste dans son erreur. Cela remet en cause la fiabilité réelle de ces outils pourtant présentés comme plus rigoureux.

Les experts avancent plusieurs hypothèses pour expliquer ce phénomène. Des choix de conception, comme le renforcement basé sur les résultats, pourraient aggraver les hallucinations. De plus, OpenAI aurait réduit ses phases de tests de sécurité pour accélérer le développement de ses modèles. Cette stratégie, si elle permet d'innover plus vite, expose les utilisateurs à plus de contenus erronés. En attendant de meilleures solutions, la prudence reste indispensable : même les IA les plus avancées doivent être utilisées avec un regard critique.


Abonnez-vous gratuitement à la newsletter

Chaque jour, le meilleur de Phonandroid dans votre boite mail !

Réagissez à cet article !

Demandez nos derniers articles !

LinkedIn est envahi de posts écrits par l’IA, surtout sur ces deux sujets

Une étude portant sur les posts du réseau social LinkedIn montrent que de plus en plus sont générés à l’aide de l’intelligence artificielle. Avec des différences selon les sujets et…

IA

Votre Apple TV 4K rame quand vous regardez des films ? Cet internaute a trouvé la solution et c’est du génie

Un utilisateur de Reddit se plaignait de voir son Apple TV 4K souffrir de stutter après une utilisation prolongée. Plutôt que de racheter un nouveau modèle, il a décidé de…

Vous décrochez quand vous lisez ? Voici l’option de lecture immersive d’Audible pour vous faire garder le fil

Audible, l’application de livres audio d’Amazon, reçoit une nouvelle fonctionnalité. Si vous avez du mal à rester concentré lorsque vous lisez, elle pourrait vous être bien utile : elle pousse la…

De plus en plus de Galaxy Z TriFold ont de graves problèmes d’écran, l’inquiétude monte

Les témoignages faisant état de Samsung Galaxy TriFold dont les écrans internes cessent de fonctionner du jour au lendemain se multiplient. Chez un utilisateur, c’est arrivé à peine 5 jours…

Google Pixel 10a pas cher : où précommander le smartphone au meilleur prix ?

Comme chaque année, Google agrandit la gamme des smartphones Pixel 10. Il aura fallu attendre seulement 6 mois après la sortie des Pixel 10, 10 Pro et 10 Pro XL…

L’IA accélère la performance des entreprises à travers toute l’Europe, cette étude le prouve

L’intelligence artificielle progresse rapidement dans les entreprises européennes. Ses effets réels sur la productivité restent pourtant débattus. Une vaste étude apporte aujourd’hui des réponses concrètes. Depuis plusieurs mois, les annonces…

IA

Firefox sera bientôt obsolète sur ces anciennes versions de Windows, il va falloir mettre à jour votre PC

Mozilla vient d’annoncer, pour la quatrième fois, la fin des mises à jour de sécurité de son navigateur Mozilla pour les plus anciennes versions de Windows. Les utilisateurs restant feront…

Vous avez galéré devant ce boss ? L’application Xbox sur PC va célébrer votre victoire avec cette nouvelle fonctionnalité

Microsoft teste actuellement une nouvelle fonctionnalité de son application Xbox sur PC auprès des membres deu programme Insider. Celle-ci consiste à générer des récapitulatifs de votre session de jeu en…

Le mythe des batteries de voitures électriques qui s’usent vite s’effondre avec ces chiffres

Les batteries des voitures électriques inquiètent encore de nombreux acheteurs. Leur durée de vie reste entourée d’idées reçues. Une nouvelle étude vient pourtant bousculer ces certitudes. Depuis plusieurs années, la…

1,2 million d’IBAN exposés après le piratage massif de la DGFiP : voici comment vous protéger

Des pirates ont exploité une faille de la Direction Générale des Finances publiques : 1,2 million d’IBAN français sont exposés, mais pas uniquement. Cela représente un véritable risque de phishing…