• Le choix d'OpenAI de fournir Sora à des testeurs de sécurité indépendants démontre leur engagement à lutter contre l'éventuelle utilisation abusive de fausses vidéos photoréalistes.
  • Avec le modèle phare de génération de texte en image d'OpenAI, utilisant un réseau de neurones transformeur, l'équipe derrière Sora a introduit une nouvelle approche pour générer des vidéos à partir de descriptions textuelles.

OpenAI a récemment dévoilé un modèle révolutionnaire de génération vidéo nommé Sora, démontrant sa capacité à transformer de courtes descriptions textuelles en clips vidéo haute définition détaillés d'une durée maximale d'une minute. Cette technologie innovante marque une avancée significative dans le domaine de la génération de texte en vidéo, reflétant l'engagement d'OpenAI à développer des systèmes d'IA capables de comprendre des interactions complexes dans notre monde.

La prudence d'OpenAI dans la révélation d'une technologie de pointe

Tim Brooks, chercheur chez OpenAI, a souligné l'importance de construire des modèles capables de comprendre le contenu vidéo, mettant en évidence les implications potentielles pour les avancées futures de l'IA. La décision de l'entreprise de dévoiler Sora dans des conditions de secret strict souligne son approche prudente quant à la divulgation de cette technologie de pointe.

Alors que les précédents modèles de génération vidéo produisaient souvent des résultats saccadés et granuleux, Sora se distingue par sa sortie haute définition et son souci du détail. OpenAI a démontré la capacité de Sora à créer des vidéos avec des interactions d'objets en 3D et des transitions fluides entre les scènes, illustrant les progrès dans la gestion de l'occlusion — un défi courant dans les modèles existants.

Lire aussi: OpenAI guérit la « paresse » de GPT-4 avec de nouvelles mises à jour

Améliorer la cohérence à long terme dans Sora

Malgré ses capacités impressionnantes, Sora n'est pas sans limites. Brooks a reconnu des axes d'amélioration en matière de cohérence à long terme, où le modèle peut avoir du mal à maintenir la cohérence lorsque des objets sortent du cadre pendant de longues périodes. La décision d'OpenAI de partager Sora avec des testeurs de sécurité tiers reflète son engagement à lutter contre l'éventuelle utilisation abusive de fausses vidéos photoréalistes.

DALL·E 3 est un modèle de génération de texte en image développé par OpenAI utilisant des méthodologies d'apprentissage profond pour générer des images numériques à partir de descriptions en langage naturel. En combinant des éléments de DALL-E 3, le modèle phare de génération de texte en image d'OpenAI, avec un réseau de neurones transformeur, l'équipe derrière Sora a introduit une nouvelle approche pour générer des vidéos à partir de descriptions textuelles. Cette méthodologie unique permet à Sora de traiter les données vidéo en segments, ce qui permet un entraînement sur une gamme variée de types de vidéos en termes de résolution, de durée et d'orientation.

Lire aussi: OpenAI dévoile les capacités vocales de ChatGPT, plaisante sur le drame de son PDG, alors qu'une lettre émerge exprimant des préoccupations sur l'IAG

Concilier innovation et utilisation responsable

Sam Gregory, directeur exécutif de Witness, a salué l'innovation technique derrière Sora, mais a mis en garde contre les risques associés à la technologie de génération vidéo. Il a souligné le potentiel de désinformation et d'utilisation abusive dans la manipulation de contenus vidéo réalistes, insistant sur l'importance de mesures de sauvegarde proactives dans la création et la diffusion de contenu.

Alors qu'OpenAI relève les défis d'un déploiement responsable de Sora, l'entreprise a mis en place des filtres pour bloquer les demandes de contenu inapproprié et prévoit d'intégrer des mécanismes de détection de fausses images et des balises de métadonnées standard de l'industrie dans les résultats du modèle. Malgré ces mesures, l'évolution du paysage de la création de contenu synthétique pose des défis continus pour maintenir l'intégrité du contenu et atténuer les risques d'utilisation abusive.