ChatGPT-5 VS 4o : ce test à l’aveugle révèle l’IA préférée des utilisateurs

Un site propose aux utilisateurs de tester à l’aveugle leur préférence entre deux modèles d’OpenAI : ChatGPT-5 et son prédécesseur GPT-4o. Et les résultats, au-delà de dévoiler le gagnant, mettent en lumière des enjeux clés liés à l’avenir de l’IA.

OpenAI ChatGPT dépendance Atlman — Crédits : 123RF

Les battles d’IA à l’aveugle ne sont plus une nouveauté. Il est en effet courant de vouloir comparer des services similaires, et quelle meilleure méthode que l’anonymisation pour être impartial ?

Des sites comme lmarena.ai proposent de comparer des IA à l’aveugle. Le but ? Déterminer le modèle préféré des utilisateurs. C’est sur ce principe que repose un nouveau site, qui répond à la polémique qui a accompagné la suppression des anciens modèles d’OpenAI lors du lancement de ChatGPT-5.

ChatGPT-5 VS GPT-4o : les résultats de ce test à l’aveugle en disent beaucoup sur l’avenir de l’IA

Un développeur anonyme, @flowersslop sur X, a créé un site permettant aux utilisateurs de comparer à l’aveugle ChatGPT-5 (sans le mode réflexion) et son prédécesseur, GPT-4o. L’outil propose aux internautes des paires de réponses couvrant des domaines variés sur plusieurs tours (5, 10 ou 20), et ils n’ont qu’à voter pour leurs préférées. Ils reçoivent ensuite un résumé leur précisant le modèle qu’ils ont privilégié. D’après nos confrères de VentureBeat, les premiers résultats publiés sur les réseaux sociaux révèlent que si une légère majorité semble préférer GPT-5, une partie significative préfère toujours GPT-4o – probablement ceux qui s’étaient révoltés à sa suppression.

Ces résultats mettent aussi en lumière un tableau complexe et des questions cruciales qui divisent le secteur de l’IA, notamment à cause des dérives qu’elle peut engendrer – telles que la dépendance émotionnelle de certains utilisateurs. Les utilisateurs qui ont recours à l’IA dans des domaines techniques préfèrent la franchise et la précision de GPT-5, quand ceux qui l’utilisent pour un soutien émotionnel ou une aide à la créativité lui préfèrent GPT-4o et sa complaisance. Or, Webb Keane, professeur d'anthropologie, a d’ailleurs déclaré à TechCrunch que la flagornerie est un schéma de manipulation, qui consiste à « créer un comportement addictif », donc lucratif. Et OpenAI peine à trouver un équilibre : face à l’ampleur de la controverse, l’entreprise a ressuscité ChatGPT-4o seulement 24 heures après sa suppression.

Ainsi, ces résultats montrent que les progrès techniques seuls ne suffisent plus à garantir la satisfaction des utilisateurs, et que des critères subjectifs comme la personnalité des IA pourraient être les prochains leviers concurrentiels. C’est un enjeu clé pour les entreprises : la préférence des utilisateurs pourrait devenir l’indicateur déterminant du succès. L’avenir de l’IA pourrait donc reposer sur la capacité des entreprises à concilier personnalisation et standardisation pour s’adapter aux besoins et préférences variés des utilisateurs, plutôt que sur la recherche du « modèle parfait ».

Abonnez-vous gratuitement à la newsletter

Chaque jour, le meilleur de Phonandroid dans votre boite mail !

Newsletter

Inscrivez-vous à la newsletter de PhonAndroid, des news sans pub rien que pour vous !

ChatGPT-5 VS 4o : ce test à l’aveugle révèle l’IA préférée des utilisateurs

ChatGPT-5 VS GPT-4o : les résultats de ce test à l’aveugle en disent beaucoup sur l’avenir de l’IA

La rédaction vous conseille aussi...

Abonnez-vous gratuitement à la newsletter

Réagissez à cet article !

Demandez nos derniers articles !

Le Galaxy S26 blanc et le Galaxy S26 Ultra violet dévoilés avant l’heure

Voici les 5 voitures les plus volées en France

Spotify affiche désormais des anecdotes sur les chansons que vous écoutez

Huawei lance une vague de promos inédites pour la Saint-Valentin : les prix sont en forte baisse

Ninja CREAMi Scoop & Swirl : la machine à glace 13-en-1 passe à petit prix, c’est parfait pour les gourmands !

La sortie de GTA 6 pourrait repousser celle de Fable et d’autres jeux Xbox

Cette montre connectée pas chère vous vend du rêve ? Attendez avant de craquer : ses mesures sont peut-être fictives

Samsung baisse drastiquement le prix de la Galaxy Watch 8 et offre un cadeau en bonus

Disney+ perd le Dolby Vision et le HDR10+, mais vous paierez toujours aussi cher

Pas de téléphone Starlink selon Elon Musk, mais quelque chose d’inédit serait en préparation