Microsoft présente un successeur de ChatGPT qui sait résoudre des puzzles et traite les images

Une équipe de chercheurs de Microsoft a présenté une nouvelle IA encore plus polyvalente que le fameux ChatGPT. Elle est non seulement capable de répondre aux questions textuelles, mais elle peut aussi analyser et traiter des images.

main robot laptop
Crédit : 123rf

Dans un article titré « Le langage n’est pas tout ce dont vous avez besoin : aligner la perception et les modèles de langage » (Language Is Not All You Need: Aligning Perception with Language Models), des chercheurs de Microsoft ont présenté Kosmos-1. Comme ils le rappellent dans l’introduction de leur papier, « une grande convergence du langage, de la perception multimodale, de l’action et de la modélisation du monde est une étape clé vers l’intelligence artificielle généraliste ».

À lire — ChatGPT met toujours plus d’employés au chômage

On le sait, Microsoft apprécie tellement ChatGPT qu’elle a investi plusieurs milliards de dollars dans OpenAI, le concepteurdu chatbot. La firme de Redmond souhaite intégrer cette invention dans plusieurs de ses logiciels. Le moteur de recherche de la compagnie, Bing, utilise GPT 3.5, une évolution du modèle de langage utilisé par ChatGPT. Mais la firme de Redmond ne compte pas s’arrêter là. Une véritable IA généraliste ne pourra pas se contenter de comprendre un texte. Elle devra être en mesure d’interpréter des images et leurs contextes, ou bien de comprendre des signaux sonores. En d’autres termes, elle devra, tout comme l’être humain, exploiter les cinq sens.

Kosmos-1 va succéder à ChatGPT, il comprend les textes et les images

La nouvelle IA présentée par Microsoft, est capable de faire la même chose que ChatGPT, et plus encore. En effet, Kosmos-1 n’est pas qu’un agent conversationnel. Selon ses créateurs, « il atteint des performances impressionnantes en matière de compréhension et de génération de langage, de dialogue multimodal, de sous-titrage d’images, de réponse à des questions visuelles et de tâches de vision (telles que la classification selon des instructions textuelles) ».

kosmos-1 microsoft ia
Un questionnaire visuel soumis à Kosmos-1 / Crédit : Microsoft

 

On se rapproche donc encore plus du fameux concept d’Intelligence artificielle généraliste, qui pourra remplacer l’être humain dans toutes les tâches intellectuelles. Faut-il s’en réjouir ou s’en inquiéter ? Une chose est sûre, c’est que l’IA est d’ores et déjà en train de bouleverser notre société.


Abonnez-vous gratuitement à la newsletter

Chaque jour, le meilleur de Phonandroid dans votre boite mail !

Réagissez à cet article !

Demandez nos derniers articles !

Vous pouvez animer votre photo de profil Facebook par IA, voici comment faire

Facebook donne la possibilité aux utilisateurs de personnaliser leur photo de profil, leurs Stories, leurs Souvenirs et leurs publications textuelles par IA. Facebook annonce le déploiement de nouvelles fonctions basées…

Vous pouvez installer iOS 26.3 sur votre iPhone, quelles nouveautés pour la mise à jour ?

Apple a déployé la version stable de la mise à jour iOS 26.3 pour l’iPhone. Celle-ci apporte plusieurs nouvelles fonctionnalités, dont certaines sont exclusives à l’Europe. Les propriétaires d’iPhone attendent…

La première bêta d’Android 17 est disponible, quels smartphones sont compatibles et comment la télécharger

La bêta 1 d’Android 17 est disponible sur de nombreux modèles de smartphones Pixel, on vous explique comment l’installer sur votre appareil. Google avait laissé entendre que la bêta 1…

Le destin mystérieux de C/2019 Y4 ATLAS ou comment une occasion manquée est transformée en chance pour la science

C/2019 Y4 ATLAS est une comète qui intrigue particulièrement les astronomes : elle n’a en rien répondu à leurs estimations. Alors qu’elle aurait dû offrir un spectacle céleste à l’œil nu…

La Chine va fixer les règles du jeu pour les batteries solides avec cette nouvelle norme

La Chine veut prendre de l’avance dans la course aux batteries solides. Elle s’apprête à publier une norme nationale pour encadrer leur développement. Ce choix stratégique pourrait accélérer leur arrivée…

L’iPhone 18 Pro compterait sur la 5G par satellite pour supprimer une fois pour toutes les zones blanches

Apple a érigé la connectivité par satellite comme priorité pour ses prochains iPhone. De nouvelles fonctionnalités arrivent, certaines permises par le nouveau modem C2. Apple a été le premier fabricant…

SFR va lancer une box WiFi 7 disponible pour tous, le chant du cygne de l’opérateur ?

SFR a annoncé relativement discrètement le lancement d’une nouvelle box Internet compatible avec le WiFi 7. Celle-ci fait suite à la SFR Box+, disponible uniquement aux abonnés Fibre Premium, mais…

DLSS 4.5 : pour se rendre compte du potentiel de la technologie de Nvidia, il faut l’activer sur des jeux non-compatibles

Il ne fait aucun doute que le DLSS n’a cessé de s’améliorer au fil des mises à jour, mais sa dernière version fait passer la technologie d’upscaling a un toute…

Windows 11 : mettez vite votre PC à jour, cette faille critique du Bloc-notes permet le piratage de votre appareil à distance

Longtemps cantonné à un simple logiciel de traitement de texte, le Bloc-notes a connu plusieurs évolutions ces derniers temps – qui n’ont pas forcément été au goût de tous. Une…

Nvidia évoque une nouvelle Shield TV, avec support HDR10+ et un changement majeur pour la télécommande

Un nouveau modèle de Shield TV pourrait voir le jour, et Nvidia sait déjà quelles nouveautés y seraient intégrées. Nvidia a lancé sa première Shield TV en 2015, puis de…

TV