Microsoft présente un successeur de ChatGPT qui sait résoudre des puzzles et traite les images

Une équipe de chercheurs de Microsoft a présenté une nouvelle IA encore plus polyvalente que le fameux ChatGPT. Elle est non seulement capable de répondre aux questions textuelles, mais elle peut aussi analyser et traiter des images.

main robot laptop
Crédit : 123rf

Dans un article titré « Le langage n’est pas tout ce dont vous avez besoin : aligner la perception et les modèles de langage » (Language Is Not All You Need: Aligning Perception with Language Models), des chercheurs de Microsoft ont présenté Kosmos-1. Comme ils le rappellent dans l’introduction de leur papier, « une grande convergence du langage, de la perception multimodale, de l’action et de la modélisation du monde est une étape clé vers l’intelligence artificielle généraliste ».

À lire — ChatGPT met toujours plus d’employés au chômage

On le sait, Microsoft apprécie tellement ChatGPT qu’elle a investi plusieurs milliards de dollars dans OpenAI, le concepteurdu chatbot. La firme de Redmond souhaite intégrer cette invention dans plusieurs de ses logiciels. Le moteur de recherche de la compagnie, Bing, utilise GPT 3.5, une évolution du modèle de langage utilisé par ChatGPT. Mais la firme de Redmond ne compte pas s’arrêter là. Une véritable IA généraliste ne pourra pas se contenter de comprendre un texte. Elle devra être en mesure d’interpréter des images et leurs contextes, ou bien de comprendre des signaux sonores. En d’autres termes, elle devra, tout comme l’être humain, exploiter les cinq sens.

Kosmos-1 va succéder à ChatGPT, il comprend les textes et les images

La nouvelle IA présentée par Microsoft, est capable de faire la même chose que ChatGPT, et plus encore. En effet, Kosmos-1 n’est pas qu’un agent conversationnel. Selon ses créateurs, « il atteint des performances impressionnantes en matière de compréhension et de génération de langage, de dialogue multimodal, de sous-titrage d’images, de réponse à des questions visuelles et de tâches de vision (telles que la classification selon des instructions textuelles) ».

kosmos-1 microsoft ia
Un questionnaire visuel soumis à Kosmos-1 / Crédit : Microsoft

 

On se rapproche donc encore plus du fameux concept d’Intelligence artificielle généraliste, qui pourra remplacer l’être humain dans toutes les tâches intellectuelles. Faut-il s’en réjouir ou s’en inquiéter ? Une chose est sûre, c’est que l’IA est d’ores et déjà en train de bouleverser notre société.


Réagissez à cet article !

Demandez nos derniers articles !

Des fuites chez Samsung, un logiciel Windows piégé par un malware, c’est le récap’ de la semaine

Samsung dévoile malgré lui ses futurs smartphones pliables, un malware menace les PC Windows, Xiaomi propose de booster vos anciens téléphones, c’est le récap’ de la semaine. Cette semaine, le…

Test Honor 600 Pro : un smartphone équilibré et vraiment convaincant

Après le Honor 600, c’est au tour de sa version « Pro » de passer à la moulinette de nos tests. Plus cher et, surtout, plus ambitieux, le Honor 600 Pro reprend…

L’iPhone 18 Pro aurait une nouvelle technologie d’écran, pour quels bénéfices ?

Apple intégrerait pour la première fois des écrans de technologie LTPO+ pour ses iPhone 18 Pro, plus performants que les affichages LTPO traditionnels. Les iPhone 18 Pro et 18 Pro…

L’aide à la rédaction par IA de Gmail s’améliore, voici ce qui change

L’outil d’aide à la rédaction par IA de Gmail devient plus pertinent en prenant désormais en compte le contexte personnel de l’utilisateur. Des options de personnalisation du ton et du…

Instagram supprime le chiffrement de bout en bout, vos messages privés ne sont plus protégés

La sécurité de vos messages privés sur Instagram a pris un coup. Le réseau social vient d’annoncer la fin de la prise en charge du chiffrement de bout en bout,…

Les consoles portables sous Windows vont gagner en autonomie grâce à cette initiative de Xbox

Le projet Green Leaf de Xbox vise à réduire la consommation d’énergie des jeux afin d’améliorer l’autonomie des consoles portables tournant sous Windows. Xbox est au four et au moulin…

Le air fryer Ninja DualZone XL passe à petit prix en cumulant ces 2 offres, c’est le moment d’en profiter !

Vous cherchez un airfryer polyvalent pour cuisiner pour toute la famille ? La friteuse sans huile Ninja DualZone XL profite d’une grande capacité de 7,6 L divisée en deux zones….

Avec Android 17, l’écran d’accueil va enfin devenir plus personnalisable pour les Pixel

Google pourrait enfin laisser les utilisateurs supprimer la fameuse barre de recherche de l’écran d’accueil des Pixel dans une prochaine version d’Android 17. Le widget de barre de recherche Google…

Une fonctionnalité discrète mais très appréciée de Google Photos disparaît cet été. Elle concerne les utilisateurs qui sauvegardent leurs photos depuis un ordinateur. Google a déjà fixé les dates, et…

PC

Voici pourquoi certaines mises à jour Windows 11 prennent autant de temps à s’installer

Une mise à jour Windows 11 qui s’éternise après le téléchargement, ça arrive à tout le monde. Microsoft vient enfin de lever le voile sur ce comportement mystérieux. Et la…