Concurrence
Après ChatGPT et Dall-E, OpenAI s’attaque à la vidéo avec Sora
OpenAI vient de lancer une nouvelle intelligence artificielle, Sora. Elle doit permettre de créer des vidéos à partir d’un simple texte.
Rien ne semble capable d’arrêter l’entropie OpenAI. La société spécialisée dans le développement de l’intelligence artificielle avait déjà réussi à frapper un grand coup à la fin de l’année 2022. Elle présentait alors au monde entier ChatGPT. Le modèle de langage est depuis devenu un vrai phénomène de société, utilisé par des millions de personnes tous les jours.
Mais l’objectif pour OpenAI n’a jamais été de se limiter à ces réponses textuelles. Si ChatGPT a progressé depuis sa sortie à la fin de l’année 2022, le modèle de langage reste limité dans son processus créatif. Impossible pour lui de créer des images ou des vidéos.
C’est pour répondre à cette demande, qu’OpenAI a créé Dall-E. Cette intelligence artificielle peut concevoir des images uniques à partir d’une demande texte. Mais aujourd’hui, la société dirigée par Sam Altman veut aller encore plus loin. Elle vient d’annoncer l’arrivée de Sora, une intelligence artificielle “texte vers vidéo”.
En d’autres termes, Sora sera capable de créer de toutes pièces une vidéo de quelques secondes, simplement à partir d’une requête textuelle de l’utilisateur. Selon les dires de Sam Altman en personne, Sora serait capable de produire des vidéos d’une minute sans perte de qualité visuelle.
Afin de faire la démonstration de cette technologie, Sam Altman a demandé sur X à des internautes de rédiger leur propre prompt. Il l’a ensuite intégrée dans Sora et à partager la vidéo, à la grande surprise des utilisateurs. En effet, la création de vidéos à partir d’une simple requête est un vrai casse-tête. D’autres entreprises comme Google ont déjà essayé de développer une IA pour répondre à ces requêtes mais le résultat ne dépasse pas les quelques secondes.
https://t.co/rPqToLo6J3 pic.twitter.com/nPPH2bP6IZ
— Sam Altman (@sama) February 15, 2024
Le gros point fort de Sora, c’est sa capacité à tenir sur la distance. L’intelligence artificielle arrive à produire une vidéo mais surtout, à la faire durer. Comme l’explique OpenAI, Sora est capable de répondre à la requête de l’utilisateur mais aussi de respecter toutes les lois fondamentales de la physique (gravité, force d’attraction, mécanique des fluides…).
Pour l’heure Sora n’est pas disponible pour le grand public. La création d’une vidéo est beaucoup trop énergivore pour permettre à quiconque d’utiliser ce système. Seuls quelques chercheurs et des créateurs de contenus triés sur le volet ont accès à Sora pour en faire des démonstrations.
Il faut attendre plusieurs heures pour que Sora arrive à produire une vidéo en qualité photo-réaliste d’une durée d’une minute. C’est encore beaucoup trop et OpenAI va travailler dans les prochains mois pour réduire autant que possible ce temps de chargement.