OpenAI lance GPT-4, une IA multimodale qui comprend à la fois le texte et les images

OpenAI a publié un nouveau modèle puissant d'IA pour la compréhension des images et des textes, GPT-4, que l'entreprise qualifie de « dernière étape dans ses efforts d'extension de l'apprentissage profond ».

ChatGPT
Crédit : toppercussion / 123RF

Après des mois de rumeurs et de spéculations, OpenAI a enfin annoncé GPT-4 : le dernier-né de sa gamme de modèles de langage d'IA qui alimentent des applications telles que ChatGPT et le nouveau Bing.

Selon la page produit du site web d'OpenAI, GPT-4 est « plus créatif et collaboratif que jamais » et « peut générer, éditer et itérer avec les utilisateurs sur des tâches d'écriture créatives et techniques, telles que la composition de chansons, l'écriture de scénarios ou l'apprentissage du style d'écriture d'un utilisateur ».

GPT-4 comprend enfin les images envoyées par les utilisateurs

L'une des principales différences entre GPT-4 et GPT-3.5 (le modèle qui alimente ChatGPT) est que la nouvelle version GPT-4 est capable d'accepter des images en plus du texte. Par exemple, si vous montrez à GPT-4 une image d'œufs, de farine et de lait et que vous lui demandez ce que vous pouvez faire avec ces ingrédients, le modèle de langage comprendra l'image et énumérera plusieurs recettes potentielles.

Vous pouvez désormais scanner des rapports de marketing et de vente, avec tous leurs graphiques et leurs chiffres, des manuels scolaires et des manuels d'utilisation, même les captures d'écran fonctionnent, et ChatGPT se chargera de tout résumer dans un dossier dans un langage adapté. Un employé d’OpenAI a même démontré qu’il était possible de créer un site web complet à partir de quelques consignes assez vagues écrites à la main sur une feuille blanche.

GPT-4 est plus intelligent que jamais

Sans surprise, GPT-4 est également beaucoup plus intelligent que les modèles précédents. Selon le document de recherche d'OpenAI, GPT-4 a réussi un examen du barreau simulé avec un score similaire à celui des 10 % de candidats les plus performants. En comparaison, ChatGPT a obtenu un score inférieur à 10 %. Le modèle linguistique multimodal a également obtenu un score de 99 % à l'Olympiade de biologie, contre 31 % pour GPT 3.5.

Un utilisateur de smartphone et d'ordinateur portable avec une incrustation ChatGPT / Crédit : 123rf

GPT-4 surpasse également ChatGPT grâce à ses capacités de raisonnement avancées et peut produire des réponses plus concises et plus précises que ChatGPT.

Lire également – ChatGPT a le cerveau d’un enfant de neuf ans

GPT-4 n’est pas encore parfait

Malgré cette importante avancée technologique, tout n’est pas encore parfait. Le PDG d'OpenAI, Sam Altman, a prévenu, avant la révélation de GPT-4, que « les gens ne demandent qu'à être déçus ». Altman a également tweeté que le modèle est « toujours imparfait, toujours limité, et qu'il semble toujours plus impressionnant à la première utilisation qu'il ne l'est après avoir passé plus de temps avec lui ».

chatgpt
Crédits : 123rf

L'OpenAI met également en garde contre le fait que les systèmes conservent un grand nombre des mêmes problèmes que les modèles de langage antérieurs, notamment une tendance à inventer des informations et la capacité de générer des textes violents et préjudiciables. Cependant, selon OpenAI, il est également plus difficile pour GPT-4 d'échapper aux garde-fous qui limitent ses possibilités d'utilisation.

Comment essayer GPT-4 ?

OpenAI indique que le GPT-4 sera bientôt disponible à la fois pour ChatGPT et pour l'API. Vous devrez être un abonné ChatGPT Plus pour y avoir accès, et sachez qu'il y aura également une limite d'utilisation pour jouer avec le nouveau modèle. L'accès à l'API pour le nouveau modèle est géré par une liste d'attente.

L’API permettra aux programmeurs d'intégrer l'IA dans leurs applications. OpenAI facturera environ 3 cents pour 750 mots de question et 6 cents pour 750 mots de réponse. La bonne nouvelle, c’est qu’il sera peut-être possible pour vous d’essayer GPT-4 gratuitement à un moment donné. « En fonction des modèles de trafic que nous observons, nous pourrions introduire un nouveau niveau d'abonnement pour une utilisation plus importante de GPT-4 ; nous espérons également à un moment donné offrir un certain nombre de requêtes GPT-4 gratuites afin que ceux qui n'ont pas d'abonnement puissent également l'essayer », explique la société.


Abonnez-vous gratuitement à la newsletter

Chaque jour, le meilleur de Phonandroid dans votre boite mail !

Réagissez à cet article !

Demandez nos derniers articles !

Disney+ : voici la liste des nouveaux films et séries à venir en février 2026

Disney vient de dévoiler la liste détaillée des prochaines séries et films à venir sur Disney+ et sur le catalogue Star. Que nous réserve la programmation de février 2026 ?…

Windows 11 : le bug qui a bloqué Chrome pendant des mois est enfin corrigé

Il ne fallait pas s’attendre à une annonce en grandes pompes pour ce correctif qui a pourtant affecté de nombreux utilisateurs pendant plusieurs mois. Dans un récent rapport, Microsoft annonce…

One UI 9 : Samsung testerait déjà la prochaine version de sa surcouche sur les futurs Galaxy Z Fold 8 et Z Flip 8

Alors que One UI 8.5 n’est même pas encore sortie dans sa version stable, une rumeur affirme que Samsung testerait déjà la prochaine version de sa surcouche sur ses prochains smartphones…

Ils envoyaient des SMS frauduleux en circulant dans les rues de Paris : 8 personnes font face à la justice

Six hommes et deux femmes se retrouvent devant le juge pour une affaire d’arnaque aux SMS. Le groupe utilisait illégalement un IMSI-catcher pour envoyer des messages frauduleux sur les smartphones…

Windows 11 pourrait bientôt permettre de bouger la barre des tâches, après des années à supplier Microsoft

Il se pourrait bien que Microsoft ait fini par plier face aux demandes incessantes des utilisateurs. Selon des informations obtenues pas Windows Central, Windows 11 intégrerait bientôt la possibilité de…

Voici les rendus de l’iPhone 17e, un modèle abordable qui ressemble à un haut de gamme

Une nouvelle fuite révèle le design et les premières infos techniques de l’iPhone 17e. Ce modèle abordable adopte un look haut de gamme et des composants modernes. Apple semble viser…

Flemme de lire ce document Google Docs interminable ? Gemini vous en fait désormais un résumé audio

La firme de Mountain View renforce la présence de Gemini dans Google Docs. Après la génération de résumés, la lecture à voix haute et la transformation des documents en podcast,…

Chrome sur Android accueille enfin cette option pratique de la version PC

Le rapprochement entre Chrome version mobile et version bureau continue. L’application Android du navigateur va gagner cette fonctionnalité bien utile pour pas mal d’utilisateurs. Ça paraît bête à dire, mais…

PS5 : un nouveau God of War, le DLC de Ghost of Yotei, Pragmata se montre encore, toutes les plus grosses annonces du State of Play

Hier soir s’est tenu un très gros State of Play qui, comme à son habitude, a dévoilé les prochaines cartouches de Sony pour sa PS5. La soirée a été très…

GeForce Now est disponible sur les Fire TV d’Amazon, voici les modèles compatibles

Environ un mois après son annonce, Nvidia déploie son service de cloud gaming GeForce Now à certains dispositifs Fire TV d’Amazon. Voyons lesquels y ont droit et pour quel résultat….