ChatGPT-5 VS 4o : ce test à l’aveugle révèle l’IA préférée des utilisateurs

Un site propose aux utilisateurs de tester à l’aveugle leur préférence entre deux modèles d’OpenAI : ChatGPT-5 et son prédécesseur GPT-4o. Et les résultats, au-delà de dévoiler le gagnant, mettent en lumière des enjeux clés liés à l’avenir de l’IA.

OpenAI ChatGPT dépendance Atlman
Crédits : 123RF

Les battles d’IA à l’aveugle ne sont plus une nouveauté. Il est en effet courant de vouloir comparer des services similaires, et quelle meilleure méthode que l’anonymisation pour être impartial ?

Des sites comme lmarena.ai proposent de comparer des IA à l’aveugle. Le but ? Déterminer le modèle préféré des utilisateurs. C’est sur ce principe que repose un nouveau site, qui répond à la polémique qui a accompagné la suppression des anciens modèles d’OpenAI lors du lancement de ChatGPT-5.

ChatGPT-5 VS GPT-4o : les résultats de ce test à l’aveugle en disent beaucoup sur l’avenir de l’IA

Un développeur anonyme, @flowersslop sur X, a créé un site permettant aux utilisateurs de comparer à l’aveugle ChatGPT-5 (sans le mode réflexion) et son prédécesseur, GPT-4o. L’outil propose aux internautes des paires de réponses couvrant des domaines variés sur plusieurs tours (5, 10 ou 20), et ils n’ont qu’à voter pour leurs préférées. Ils reçoivent ensuite un résumé leur précisant le modèle qu’ils ont privilégié. D’après nos confrères de VentureBeat, les premiers résultats publiés sur les réseaux sociaux révèlent que si une légère majorité semble préférer GPT-5, une partie significative préfère toujours GPT-4o – probablement ceux qui s’étaient révoltés à sa suppression.

Ces résultats mettent aussi en lumière un tableau complexe et des questions cruciales qui divisent le secteur de l’IA, notamment à cause des dérives qu’elle peut engendrer – telles que la dépendance émotionnelle de certains utilisateurs. Les utilisateurs qui ont recours à l’IA dans des domaines techniques préfèrent la franchise et la précision de GPT-5, quand ceux qui l’utilisent pour un soutien émotionnel ou une aide à la créativité lui préfèrent GPT-4o et sa complaisance. Or, Webb Keane, professeur d'anthropologie, a d’ailleurs déclaré à TechCrunch que la flagornerie est un schéma de manipulation, qui consiste à « créer un comportement addictif », donc lucratif. Et OpenAI peine à trouver un équilibre : face à l’ampleur de la controverse, l’entreprise a ressuscité ChatGPT-4o seulement 24 heures après sa suppression.

Ainsi, ces résultats montrent que les progrès techniques seuls ne suffisent plus à garantir la satisfaction des utilisateurs, et que des critères subjectifs comme la personnalité des IA pourraient être les prochains leviers concurrentiels. C’est un enjeu clé pour les entreprises : la préférence des utilisateurs pourrait devenir l’indicateur déterminant du succès. L’avenir de l’IA pourrait donc reposer sur la capacité des entreprises à concilier personnalisation et standardisation pour s’adapter aux besoins et préférences variés des utilisateurs, plutôt que sur la recherche du « modèle parfait ».


Abonnez-vous gratuitement à la newsletter
Chaque jour, le meilleur de Phonandroid dans votre boite mail !
Réagissez à cet article !
Demandez nos derniers articles !