Bing AI va bientôt vous laisser faire des recherches avec des images et devient multimodal

Microsoft a officialisé sur les réseaux sociaux l’intégration de GPT-4 dans Bing AI et dans Edge.

Bing Chat

Les produits de Microsoft ont été pendant plusieurs mois à la pointe de l’innovation en matière d’intégration de l’Intelligence artificielle. Mais avec l’apparition d’IA toujours plus performantes et accessibles, l’avance de la firme de Redmond en la matière fond comme un sorbet au soleil. En effet, Bard, l'IA de Google, même si elle est arrivée plus tard sur le marché, est déjà multimodale. C’est Mikhail Parakhin, le directeur de la publicité et des services de Microsoft en personne, qui a annoncé ce matin sur Twitter que l’IA de Microsoft passe à l’étape supérieure et devient, elle aussi, multimodale.

À lire — ChatGPT s’est trouvé un sérieux concurrent, que sait-on de Claude 2 ?

M. Parakhin déclare sur le réseau social : « OK, nous avons finalement déployé la compréhension multimodale/image partout (enfin, presque — le déploiement sera terminé demain, mais à 99 % aujourd’hui) ». OpenAI avait lancé GPT-4, la « dernière étape dans ses efforts d’extension de l’apprentissage profond » en mars 2023. En effet, ce nouveau grand modèle de langage comprend non seulement les textes, mais aussi les images. Avec cette nouvelle capacité, Bing AI pourra donc écrire un poème en fonction d’une image ou encore générer une mélodie en fonction d’une description textuelle, par exemple.

Bing AI acquiert une capacité multimodale : il reconnaît différents types de contenu

Quatre mois après l’officialisation du nouveau LLM d’OpenAI, les ingénieurs de Microsoft sont donc en train de l’implémenter dans les produits de la compagnie. La recherche par image dans Bing Chat et/ou Edge, c’est pour demain… et c’est révolutionnaire. Malgré l’enthousiasme qu’une telle annonce peut susciter, il subsiste quelques problèmes qui suggèrent que le lancement ne se fera pas sans quelques accrocs.

Un membre de Twitter, qui a pu tester cette nouvelle IA multimodale en avant-première a ainsi adressé la plainte suivante au représentant de la compagnie : « le seul gros problème est que si je télécharge une image et que j’utilise ensuite le microphone pour poser ma question, Bing dit qu’il n’y a pas d’image. L’image et le micro ne fonctionnent donc pas ensemble, je suppose ».


Abonnez-vous gratuitement à la newsletter
Chaque jour, le meilleur de Phonandroid dans votre boite mail !
Réagissez à cet article !
Demandez nos derniers articles !