ChatGPT-5 VS 4o : ce test à l’aveugle révèle l’IA préférée des utilisateurs

Un site propose aux utilisateurs de tester à l’aveugle leur préférence entre deux modèles d’OpenAI : ChatGPT-5 et son prédécesseur GPT-4o. Et les résultats, au-delà de dévoiler le gagnant, mettent en lumière des enjeux clés liés à l’avenir de l’IA.

OpenAI ChatGPT dépendance Atlman
Crédits : 123RF

Les battles d’IA à l’aveugle ne sont plus une nouveauté. Il est en effet courant de vouloir comparer des services similaires, et quelle meilleure méthode que l’anonymisation pour être impartial ?

Des sites comme lmarena.ai proposent de comparer des IA à l’aveugle. Le but ? Déterminer le modèle préféré des utilisateurs. C’est sur ce principe que repose un nouveau site, qui répond à la polémique qui a accompagné la suppression des anciens modèles d’OpenAI lors du lancement de ChatGPT-5.

ChatGPT-5 VS GPT-4o : les résultats de ce test à l’aveugle en disent beaucoup sur l’avenir de l’IA

Un développeur anonyme, @flowersslop sur X, a créé un site permettant aux utilisateurs de comparer à l’aveugle ChatGPT-5 (sans le mode réflexion) et son prédécesseur, GPT-4o. L’outil propose aux internautes des paires de réponses couvrant des domaines variés sur plusieurs tours (5, 10 ou 20), et ils n’ont qu’à voter pour leurs préférées. Ils reçoivent ensuite un résumé leur précisant le modèle qu’ils ont privilégié. D’après nos confrères de VentureBeat, les premiers résultats publiés sur les réseaux sociaux révèlent que si une légère majorité semble préférer GPT-5, une partie significative préfère toujours GPT-4o – probablement ceux qui s’étaient révoltés à sa suppression.

Ces résultats mettent aussi en lumière un tableau complexe et des questions cruciales qui divisent le secteur de l’IA, notamment à cause des dérives qu’elle peut engendrer – telles que la dépendance émotionnelle de certains utilisateurs. Les utilisateurs qui ont recours à l’IA dans des domaines techniques préfèrent la franchise et la précision de GPT-5, quand ceux qui l’utilisent pour un soutien émotionnel ou une aide à la créativité lui préfèrent GPT-4o et sa complaisance. Or, Webb Keane, professeur d'anthropologie, a d’ailleurs déclaré à TechCrunch que la flagornerie est un schéma de manipulation, qui consiste à « créer un comportement addictif », donc lucratif. Et OpenAI peine à trouver un équilibre : face à l’ampleur de la controverse, l’entreprise a ressuscité ChatGPT-4o seulement 24 heures après sa suppression.

Ainsi, ces résultats montrent que les progrès techniques seuls ne suffisent plus à garantir la satisfaction des utilisateurs, et que des critères subjectifs comme la personnalité des IA pourraient être les prochains leviers concurrentiels. C’est un enjeu clé pour les entreprises : la préférence des utilisateurs pourrait devenir l’indicateur déterminant du succès. L’avenir de l’IA pourrait donc reposer sur la capacité des entreprises à concilier personnalisation et standardisation pour s’adapter aux besoins et préférences variés des utilisateurs, plutôt que sur la recherche du « modèle parfait ».


Réagissez à cet article !

Demandez nos derniers articles !

Vous pouvez générer des chansons de 3 minutes par IA avec Gemini et Lyria 3 Pro

Google lance Lyria 3 Pro, son nouveau modèle d’IA de génération de musique. Il est capable de créer des chansons de plus longue durée que les versions précédentes, et est…

Chrome sur Android est “la plateforme mobile la plus rapide pour la navigation web”, déclare Google

Les performances d’Android en matière de navigation web ont atteint des niveaux record. Les smartphones haut de gamme avec Chrome sont devenus plus rapides que les iPhone. La rapidité de…

Apple Plans va intégrer de la publicité, c’est officiel

Apple confirme ouvrir son application Plans à la publicité. Les entreprises et restaurants pourront payer pour être mis en avant par la plateforme, comme sur Google Maps. Les rumeurs de…

Windows 11 : travaillez plus vite grâce à ces 5 outils bien cachés dans le système d’exploitation

Envie de travailler plus vite sur votre PC ? Bonne nouvelle, puisque Windows 11 embarque de nombreuses fonctionnalités méconnues pour vous aider à booster votre productivité. Faisons ensemble les présentations….

Tineco Floor One S6 Stretch Lite : plus de 67% de réduction sur cet aspirateur eau et poussière, vite !

À l’occasion de l’anniversaire AliExpress, vous pouvez vous offrir l’aspirateur sec et humide Tineco Floor One S6 Stretch Lite pour moins de 165 euros grâce au code FRASPHD20. Mais attention,…

YouTube supprime le compteur de J’aime et ça ne plaît pas à tout le monde

Après avoir supprimé le compteur de Je n’aime pas il y a quelques années, YouTube semble envisager de retirer également celui des J’aime. Au plus grand dam de certains utilisateurs….

Le nouveau Ninja CRISPi PRO est enfin là, et pour fêter la sortie du airfryer, la marque vous offre un cadeau !

La famille des friteuses sans huile du géant américain s’agrandit avec un nouveau modèle : le Ninja CRISPi PRO. Ce airfryer polyvalent dispose d’un contenant en verre plus grand tout…

Avec les Bravia 2 II et Bravia 3 II, Sony démontre qu’il sait faire des TV abordables

Alors que plusieurs concurrents s’apprêtent à lancer des modèles RGB LED, Sony prend à contrepied le marché en présentant deux TV abordables : les Bravia 2 II et Bravia 3…

TV

L’application Gemini sur Android va changer du tout au tout, à quoi faut-il s’attendre ?

Google travaille sur une refonte de l’application Gemini sur Android. Plusieurs modifications d’interface vont être opérées, et on sait déjà lesquelles. L’interface de l’application Gemini sur Android ne va bientôt…

IA

iOS 27 : bouton « Ask Siri », application dédiée… voici le plan d’Apple pour enfin réinventer Siri

Siri : ce nom est synonyme de déceptions pour certains et d’espoirs pour d’autres. Attendue pour iOS 26.4, la nouvelle version de l’assistant d’Apple n’a toujours pas pointé le bout de…