OpenAI lance Sora, une IA qui peut générer des vidéos ultra réalistes

OpenAI, le créateur de ChatGPT, vient de dévoiler un nouveau modèle vidéo génératif remarquable, appelé Sora, qui peut prendre une courte description textuelle et la transformer en un clip vidéo détaillé. Voici ce que l’on sait à son sujet.

OpenAI Sora

Alors que Google vient d’annoncer sa nouvelle IA Gemini 1.5, OpenAI a immédiatement contre-attaqué avec Sora, son premier outil capable de transformer un texte en une vidéo d'une durée maximale d'une minute. Sora n'est pas une simple application de plus dans la boîte à outils numérique, mais semble bien être un symbole de ce que l'avenir réserve aux créateurs et au public.

En effet, nous sommes ici bien loin des résultats proposés par Runway AI, une autre technologie qui était capable de générer des vidéos de quelques secondes assez floues, hachées, déformées et parfois franchement dérangeantes.

Qu’est-ce que Sora, la nouvelle IA révolutionnaire d’OpenAI ?

OpenAI a baptisé son nouveau système Sora, d'après le mot japonais signifiant « ciel ». L'équipe à l'origine de la technologie, dont les chercheurs Tim Brooks et Bill Peebles, aurait choisi ce nom parce qu'il « évoque l'idée d'un potentiel créatif illimité ».

OpenAI a partagé quelques clips vidéo générés par sa nouvelle intelligence artificielle, et les résultats sont pour le moins spectaculaires. Sur l’un d’entre eux, on peut lire la requête suivante : « La belle ville enneigée de Tokyo est en pleine effervescence. La caméra se déplace dans la rue animée de la ville, suivant plusieurs personnes qui profitent du beau temps enneigé et font leurs achats dans les échoppes voisines. De magnifiques pétales de sakura volent dans le vent en même temps que les flocons de neige ». Comme demandé, la vidéo générée se déroule dans une rue à Tokyo, et montre bien que Sora a appris comment les objets s'assemblent en 3D. La caméra plonge alors dans la scène pour suivre un couple qui passe devant une rangée de magasins.

Les vidéos de l’outil d’OpenAI sont bien plus convaincantes que ce que proposent les autres outils existants, même si l’on remarque tout de même parfois quelques petits défauts. Sur l’une d’entre elles, où l’on voit une femme marcher dans la rue, on remarque par exemple sur quelques images que ses jambes ne suivent pas correctement le mouvement.

Lire égalementOpenAI veut véritablement tuer Google avec ce nouveau moteur de recherche en développement

Sora n’est pas encore disponible pour tous

Pour l’instant, Sora n’en est encore qu’au stade de développement, et n’est donc pas disponible pour le grand public. OpenAI a cependant déjà partagé l’outil à certains universitaires et autres chercheurs qui la soumettront à une « équipe rouge ». Il s’agit d’un petit groupe de personne qui est chargé de rechercher tous les moyens de l’utiliser à mauvais escient, dans le but de comprendre les dangers que représente une telle technologie.

Ce qui est sûr, c’est qu’OpenAI devra trouver un moyen de s’assurer que ses vidéos ne sont pas utilisées à des fins de désinformation, car on imagine que certains pourraient s’en donner à cœur joie pour créer de fausses vidéos pouvant amener à des polémiques. Au début du mois, OpenAI a annoncé l'ajout de filigranes à son outil de conversion de texte en image DALL-E 3, mais précise qu'ils peuvent “être facilement supprimés”. On espère donc que l’entreprise travaille sur une nouvelle façon de s’assurer que ses fausses vidéos sont facilement identifiables.

OpenAI offre également un accès à certains artistes visuels, concepteurs et cinéastes afin de recueillir leurs commentaires. Elle note que le modèle existant peut ne pas simuler avec précision la physique d'une scène complexe et ne pas interpréter correctement certains cas de cause à effet, c’est pourquoi la technologie a encore besoin de murir avant d’être disponible plus largement.


Abonnez-vous gratuitement à la newsletter

Chaque jour, le meilleur de Phonandroid dans votre boite mail !

Réagissez à cet article !

Demandez nos derniers articles !

Vous pouvez installer iOS 26.3 sur votre iPhone, quelles nouveautés pour la mise à jour ?

Apple a déployé la version stable de la mise à jour iOS 26.3 pour l’iPhone. Celle-ci apporte plusieurs nouvelles fonctionnalités, dont certaines sont exclusives à l’Europe. Les propriétaires d’iPhone attendent…

La première bêta d’Android 17 est disponible, quels smartphones sont compatibles et comment la télécharger

La bêta 1 d’Android 17 est disponible sur de nombreux modèles de smartphones Pixel, on vous explique comment l’installer sur votre appareil. Google avait laissé entendre que la bêta 1…

Le destin mystérieux de C/2019 Y4 ATLAS ou comment une occasion manquée est transformée en chance pour la science

C/2019 Y4 ATLAS est une comète qui intrigue particulièrement les astronomes : elle n’a en rien répondu à leurs estimations. Alors qu’elle aurait dû offrir un spectacle céleste à l’œil nu…

La Chine va fixer les règles du jeu pour les batteries solides avec cette nouvelle norme

La Chine veut prendre de l’avance dans la course aux batteries solides. Elle s’apprête à publier une norme nationale pour encadrer leur développement. Ce choix stratégique pourrait accélérer leur arrivée…

L’iPhone 18 Pro compterait sur la 5G par satellite pour supprimer une fois pour toutes les zones blanches

Apple a érigé la connectivité par satellite comme priorité pour ses prochains iPhone. De nouvelles fonctionnalités arrivent, certaines permises par le nouveau modem C2. Apple a été le premier fabricant…

SFR va lancer une box WiFi 7 disponible pour tous, le chant du cygne de l’opérateur ?

SFR a annoncé relativement discrètement le lancement d’une nouvelle box Internet compatible avec le WiFi 7. Celle-ci fait suite à la SFR Box+, disponible uniquement aux abonnés Fibre Premium, mais…

DLSS 4.5 : pour se rendre compte du potentiel de la technologie de Nvidia, il faut l’activer sur des jeux non-compatibles

Il ne fait aucun doute que le DLSS n’a cessé de s’améliorer au fil des mises à jour, mais sa dernière version fait passer la technologie d’upscaling a un toute…

Windows 11 : mettez vite votre PC à jour, cette faille critique du Bloc-notes permet le piratage de votre appareil à distance

Longtemps cantonné à un simple logiciel de traitement de texte, le Bloc-notes a connu plusieurs évolutions ces derniers temps – qui n’ont pas forcément été au goût de tous. Une…

Nvidia évoque une nouvelle Shield TV, avec support HDR10+ et un changement majeur pour la télécommande

Un nouveau modèle de Shield TV pourrait voir le jour, et Nvidia sait déjà quelles nouveautés y seraient intégrées. Nvidia a lancé sa première Shield TV en 2015, puis de…

TV

Bientôt ChatGPT, Gemini et Claude directement dans votre voiture ?

L’intelligence artificielle s’invite peu à peu dans le monde automobile. Apple envisagerait d’intégrer des outils comme ChatGPT, Gemini et Claude à CarPlay. Demain, parler à sa voiture pourrait devenir aussi…