Google présente Imagen, une intelligence artificielle capable de créer des images à partir d’une simple description. La technologie combine compréhension du langage et conception d’imagerie photoréaliste. Le résultat proposé est vraiment bluffant. Et l’intelligence artificielle est même en mesure de reproduire des designs connus et d’utiliser des styles de dessin ou de peinture.

Les progrès en machine-learning et en intelligence artificielle sont énormes ces dernières années. Et il parait évident que cela continuera d’évoluer jusqu’à rattraper les romans de science-fiction. Nous savions que l’intelligence artificielle est capable de répondre à des sollicitations en langage naturel. Les assistants virtuels comme Assistant, Siri ou Alexa nous le confirment chaque jour. Nous savons aussi que l’intelligence artificielle est capable d’associer des mots avec des images. Si vous cherchez « chien » ou « plage » dans Google Photos, le moteur vous propose des résultats pertinents.

Nous savions également qu’une IA est en mesure de créer des images plus ou moins réalistes. Nous ne parlons pas uniquement de Deepfake, même si cela pourrait potentiellement s’y apparenter. Nous parlons simplement de recréer une scène à partir de… rien. Mais, imaginons un instant que nous combinons ces trois technologies : compréhension du langage, interprétation du sens et production visuelle. Cela donne Imagen, la nouvelle technologie développée par Google Brain, l’équipe de la firme dédiée à l’intelligence artificielle.

Imagen interprète une phrase et la transforme en image

Imagen est une IA tout simplement bluffante : elle crée une image à partir d’une description. Vous pouvez découvrir en tête de cet article un montage de quatre images collectées sur le site officiel d’Imagen. La description de celle en bas à gauche est simple : « un chien se regarde une glace avec curiosité. Et il y voit un chat ». Ces deux simples phrases ont suffi. Pour le visuel en bas à gauche : « un cobra géant se trouve dans un champ. Il est constitué de grain de maïs. » À la rédaction de Phonandroid, nous avons tous été étonnés du réalisme de ces images.

En vous rendant sur le site officiel, vous aurez même la possibilité de « tester » Imagen. En effet, un texte à choix multiple est proposé. Vous sélectionnez les parties qui vous intéressent et cela vous propose une image adaptée. Et, plus étonnant encore, le système propose, au choix, un montage photoréaliste ou une image imitant des styles d’artistes célèbres, comme Rembrandt.

Sur cette page officielle, vous retrouvez aussi un texte sur les limitations et l’impact sociétal qu’une telle technologie pourrait avoir. Car, Imagen pourrait être assez puissant pour créer des deepfakes de personnes publiques, sans que la victime puisse y faire grand-chose. Google confirme qu’Imagen bloque les images à tendance raciste, pornographique ou encore dégradante. Mais ce ne sont pas les seules limites que la firme impose à son système, Google évoquant aussi la tendance de son IA à créer des images avec des humains de type plutôt caucasien. Ce qui n’est pas très inclusif.