ChatGPT-5 VS 4o : ce test à l’aveugle révèle l’IA préférée des utilisateurs

Un site propose aux utilisateurs de tester à l’aveugle leur préférence entre deux modèles d’OpenAI : ChatGPT-5 et son prédécesseur GPT-4o. Et les résultats, au-delà de dévoiler le gagnant, mettent en lumière des enjeux clés liés à l’avenir de l’IA.

OpenAI ChatGPT dépendance Atlman
Crédits : 123RF

Les battles d’IA à l’aveugle ne sont plus une nouveauté. Il est en effet courant de vouloir comparer des services similaires, et quelle meilleure méthode que l’anonymisation pour être impartial ?

Des sites comme lmarena.ai proposent de comparer des IA à l’aveugle. Le but ? Déterminer le modèle préféré des utilisateurs. C’est sur ce principe que repose un nouveau site, qui répond à la polémique qui a accompagné la suppression des anciens modèles d’OpenAI lors du lancement de ChatGPT-5.

ChatGPT-5 VS GPT-4o : les résultats de ce test à l’aveugle en disent beaucoup sur l’avenir de l’IA

Un développeur anonyme, @flowersslop sur X, a créé un site permettant aux utilisateurs de comparer à l’aveugle ChatGPT-5 (sans le mode réflexion) et son prédécesseur, GPT-4o. L’outil propose aux internautes des paires de réponses couvrant des domaines variés sur plusieurs tours (5, 10 ou 20), et ils n’ont qu’à voter pour leurs préférées. Ils reçoivent ensuite un résumé leur précisant le modèle qu’ils ont privilégié. D’après nos confrères de VentureBeat, les premiers résultats publiés sur les réseaux sociaux révèlent que si une légère majorité semble préférer GPT-5, une partie significative préfère toujours GPT-4o – probablement ceux qui s’étaient révoltés à sa suppression.

Ces résultats mettent aussi en lumière un tableau complexe et des questions cruciales qui divisent le secteur de l’IA, notamment à cause des dérives qu’elle peut engendrer – telles que la dépendance émotionnelle de certains utilisateurs. Les utilisateurs qui ont recours à l’IA dans des domaines techniques préfèrent la franchise et la précision de GPT-5, quand ceux qui l’utilisent pour un soutien émotionnel ou une aide à la créativité lui préfèrent GPT-4o et sa complaisance. Or, Webb Keane, professeur d'anthropologie, a d’ailleurs déclaré à TechCrunch que la flagornerie est un schéma de manipulation, qui consiste à « créer un comportement addictif », donc lucratif. Et OpenAI peine à trouver un équilibre : face à l’ampleur de la controverse, l’entreprise a ressuscité ChatGPT-4o seulement 24 heures après sa suppression.

Ainsi, ces résultats montrent que les progrès techniques seuls ne suffisent plus à garantir la satisfaction des utilisateurs, et que des critères subjectifs comme la personnalité des IA pourraient être les prochains leviers concurrentiels. C’est un enjeu clé pour les entreprises : la préférence des utilisateurs pourrait devenir l’indicateur déterminant du succès. L’avenir de l’IA pourrait donc reposer sur la capacité des entreprises à concilier personnalisation et standardisation pour s’adapter aux besoins et préférences variés des utilisateurs, plutôt que sur la recherche du « modèle parfait ».


Abonnez-vous gratuitement à la newsletter

Chaque jour, le meilleur de Phonandroid dans votre boite mail !

Réagissez à cet article !

Demandez nos derniers articles !

Le Galaxy S26 blanc et le Galaxy S26 Ultra violet dévoilés avant l’heure

Le design des Galaxy S26 continue de se révéler, avec un bel aperçu du modèle Ultra en violet et du smartphone de base en blanc. Il ne se passe plus…

Voici les 5 voitures les plus volées en France

Certains modèles de voiture sont particulièrement ciblés par les voleurs. On sait quelles sont les 5 références les plus volées en France. Comme chaque année, le ministère de l’Intérieur a…

Spotify affiche désormais des anecdotes sur les chansons que vous écoutez

Spotify propose maintenant des anecdotes pour en savoir plus sur une chanson qui nous plaît.  Spotify annonce une nouvelle fonctionnalité pour son application mobile. Baptisée “About the Song”, qu’on peut…

Huawei lance une vague de promos inédites pour la Saint-Valentin : les prix sont en forte baisse

La Saint-Valentin fait fondre les prix chez Huawei : écouteurs, smartphones, montres connectées… la marque propose une avalanche d’offres sur son site officiel, avec des baisses de prix et des…

Ninja CREAMi Scoop & Swirl : la machine à glace 13-en-1 passe à petit prix, c’est parfait pour les gourmands !

Sortie il y a peu, la CREAMi Scoop & Swirl est exceptionnellement à prix cassé sur le site officiel de Ninja. Habituellement en vente à 349,99 €, la machine à…

La sortie de GTA 6 pourrait repousser celle de Fable et d’autres jeux Xbox

Personne ne veut sortir de jeu en même temps que Rockstar lance GTA 6, même Xbox. Et cela pourrait avoir des conséquences sur la disponibilité de Fable et quelques autres…

Cette montre connectée pas chère vous vend du rêve ? Attendez avant de craquer : ses mesures sont peut-être fictives

« Souvent copié, jamais égalé » : il existe des produits pour lesquels cette citation de Coco Chanel se vérifie et, parfois, mieux vaut mettre le prix que de prendre…

Samsung baisse drastiquement le prix de la Galaxy Watch 8 et offre un cadeau en bonus

À quelques jours de la Saint-Valentin, Samsung propose une offre alléchante sur l’un de ses produits phares. La Galaxy Watch 8, ainsi que la Watch 8 Classic sont à prix…

Disney+ perd le Dolby Vision et le HDR10+, mais vous paierez toujours aussi cher

En France, Disney+ ne propose plus le Dolby Vision et le HDR10+. La plateforme est au cœur d’une guerre de brevets qui affecte directement les utilisateurs, qui ont désormais accès…

Pas de téléphone Starlink selon Elon Musk, mais quelque chose d’inédit serait en préparation

Les rumeurs autour d’un téléphone Starlink prennent de l’ampleur. Elon Musk les a démenties, mais il a évoqué un appareil très différent. Il prépare peut-être une nouvelle vision du mobile,…