ChatGPT-5 VS 4o : ce test à l’aveugle révèle l’IA préférée des utilisateurs

Un site propose aux utilisateurs de tester à l’aveugle leur préférence entre deux modèles d’OpenAI : ChatGPT-5 et son prédécesseur GPT-4o. Et les résultats, au-delà de dévoiler le gagnant, mettent en lumière des enjeux clés liés à l’avenir de l’IA.

OpenAI ChatGPT dépendance Atlman
Crédits : 123RF

Les battles d’IA à l’aveugle ne sont plus une nouveauté. Il est en effet courant de vouloir comparer des services similaires, et quelle meilleure méthode que l’anonymisation pour être impartial ?

Des sites comme lmarena.ai proposent de comparer des IA à l’aveugle. Le but ? Déterminer le modèle préféré des utilisateurs. C’est sur ce principe que repose un nouveau site, qui répond à la polémique qui a accompagné la suppression des anciens modèles d’OpenAI lors du lancement de ChatGPT-5.

ChatGPT-5 VS GPT-4o : les résultats de ce test à l’aveugle en disent beaucoup sur l’avenir de l’IA

Un développeur anonyme, @flowersslop sur X, a créé un site permettant aux utilisateurs de comparer à l’aveugle ChatGPT-5 (sans le mode réflexion) et son prédécesseur, GPT-4o. L’outil propose aux internautes des paires de réponses couvrant des domaines variés sur plusieurs tours (5, 10 ou 20), et ils n’ont qu’à voter pour leurs préférées. Ils reçoivent ensuite un résumé leur précisant le modèle qu’ils ont privilégié. D’après nos confrères de VentureBeat, les premiers résultats publiés sur les réseaux sociaux révèlent que si une légère majorité semble préférer GPT-5, une partie significative préfère toujours GPT-4o – probablement ceux qui s’étaient révoltés à sa suppression.

Ces résultats mettent aussi en lumière un tableau complexe et des questions cruciales qui divisent le secteur de l’IA, notamment à cause des dérives qu’elle peut engendrer – telles que la dépendance émotionnelle de certains utilisateurs. Les utilisateurs qui ont recours à l’IA dans des domaines techniques préfèrent la franchise et la précision de GPT-5, quand ceux qui l’utilisent pour un soutien émotionnel ou une aide à la créativité lui préfèrent GPT-4o et sa complaisance. Or, Webb Keane, professeur d'anthropologie, a d’ailleurs déclaré à TechCrunch que la flagornerie est un schéma de manipulation, qui consiste à « créer un comportement addictif », donc lucratif. Et OpenAI peine à trouver un équilibre : face à l’ampleur de la controverse, l’entreprise a ressuscité ChatGPT-4o seulement 24 heures après sa suppression.

Ainsi, ces résultats montrent que les progrès techniques seuls ne suffisent plus à garantir la satisfaction des utilisateurs, et que des critères subjectifs comme la personnalité des IA pourraient être les prochains leviers concurrentiels. C’est un enjeu clé pour les entreprises : la préférence des utilisateurs pourrait devenir l’indicateur déterminant du succès. L’avenir de l’IA pourrait donc reposer sur la capacité des entreprises à concilier personnalisation et standardisation pour s’adapter aux besoins et préférences variés des utilisateurs, plutôt que sur la recherche du « modèle parfait ».


Réagissez à cet article !

Demandez nos derniers articles !

GTA 6 va peser une tonne, voici comment gagner de la place sur votre PS5 ou Xbox Series

GTA 6 va peser dans l’histoire du jeu vidéo… Et ce, dans tous les sens du terme. En effet, il y a fort à parier que le titre de Rockstar…

Netflix complique encore le partage de compte avec cette nouvelle contrainte

Netflix exige désormais que chaque utilisateur d’un compte partagé fournisse son adresse email. Chaque profil du compte doit donc être associé à un email. En 2023, Netflix mettait fin au…

Test Xiaomi 17T : ce smartphone est-il seulement le « maître du téléobjectif » autoproclamé ?

Moins d’un an après la sortie du Xiaomi 15T, il est déjà temps d’accueillir son successeur : le Xiaomi 17T. Plus compact que son prédécesseur, il est aussi une version « allégée »…

Dreame L40s Pro Ultra : avec cette grosse chute de prix, l’aspirateur robot devient plus abordable !

Vous cherchez un aspirateur robot à double serpillère qui reste accessible en termes de prix ? Pour ce dernier jour du Prime Day, Amazon affiche une très belle promotion sur…

YouTube Shorts fait le plein de nouveautés, dont un mode plein écran

YouTube annonce de nouvelles fonctionnalités pour ses Shorts, entre meilleure expérience de visionnage et contrôle de la vitesse de lecture. Les amateurs de Shorts peuvent se réjouir, YouTube intègre de…

La caméra de surveillance Mi 360° Home Security Camera 2K est à petit prix pour quelques heures encore !

Vous souhaitez garder un œil à l’intérieur de votre maison quand vous n’êtes pas là ? La marque Xiaomi propose un modèle de grande qualité pour un tout petit prix…

Windows 10 obtient un nouveau sursis : des mises à jour gratuites seront disponibles jusqu’à cette date

Microsoft a encore décidé de repousser la date de fin du support logiciel de Windows 10. Face aux pressions, l’éditeur a octroyé un nouveau délai aux utilisateurs. Après des mois…

Cette mise à jour Tesla pourrait vous éviter de graves blessures lors d’un accident

La sécurité automobile se joue parfois à quelques millièmes de seconde. Tesla compte bien exploiter ce laps de temps minuscule avec une nouvelle approche. La marque déploie une mise à…

Vélos électriques Fiido : ces 3 nouveaux modèles remplacent votre voiture et votre équipement de rando

Un VAE capable de tenir 225 km sur une charge et deux cargos familiaux pour en finir avec la deuxième voiture : Fiido lance trois nouveaux modèles. Et si votre…

Pour échapper à la pénurie de RAM, AMD mise sur une idée étonnante

Les prix de la RAM atteignent des sommets et plombent les budgets informatiques. Face à cette flambée, AMD décide de passer à l’offensive. La marque vient de racheter une startup…