Criadora do ChatGPT apresenta primeiro modelo neste formato. OpenAI vai testar segurança e pedir feedback de artistas para melhorar ferramenta.
Criadora do ChatGPT, a OpenAI lançou um novo modelo de inteligência artificial generativa: Sora. Em comparação com outras plataformas que geram vídeos a partir de textos, o Sora se destaca pela sua capacidade de criar conteúdos mais longos e complexos. Modelos da concorrência geralmente trabalham com durações entre quatro e dez segundos, enquanto o Sora permite a criação de vídeos de até um minuto.
Por enquanto, a ferramenta está disponível apenas para um pequeno grupo de pesquisadores, artistas visuais, designers e cineastas. Esse grupo seleto de usuários deve analisar o modelo para descobrir possíveis problemas e riscos durante o uso.
O Sora, que significa “céu” em japonês, vai demorar para ficar disponível para o público geral. Com promessa de ser bastante poderoso, o modelo que transforma textos em vídeos é capaz de entender os mínimos detalhes inclusos nos comandos.
“Sora é capaz de gerar cenas complexas com vários personagens, tipos específicos de movimento e detalhes precisos tanto no primeiro quanto no segundo plano.O modelo tem um profundo conhecimento da linguagem, o que lhe permite interpretar com precisão as instruções e gerar personagens atraentes que expressam emoções vibrantes. Sora também pode criar várias tomadas em um único vídeo gerado que mantém com precisão os personagens e o estilo visual”, afirma a OpenAI.
A OpenAI promete que sua IA conseguirá criar personagens convincentes, que expressam emoções vibrantes. Na página do modelo, a OpenAI diz que a Sora tem a habilidade de entender o que o usuário pediu e compreende como as coisas mencionadas no texto “existem no mundo físico”.
A OpenAI compartilhou nas redes sociais alguns vídeos criados a partir do Sora, junto aos comandos usados para gerar os materiais. Alguns exemplos são:
Introducing Sora, our text-to-video model.
— OpenAI (@OpenAI) February 15, 2024
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance… pic.twitter.com/Um5CWI18nS
— OpenAI (@OpenAI) February 15, 2024
Prompt: “Animated scene features a close-up of a short fluffy monster kneeling beside a melting red candle. the art style is 3d and realistic, with a focus on lighting and texture. the mood of the painting is one of wonder and curiosity, as the monster gazes at the flame with… pic.twitter.com/aLMgJPI0y6
— OpenAI (@OpenAI) February 15, 2024
A OpenAI ainda disse estar trabalhando com especialistas que estudam desinformação, conteúdo de ódio e preconceito para testar a plataforma antes de liberar ao público. A empresa também prometeu lançar ferramentas capazes de detectar vídeos gerados pelo Sora e incluir metadados nos vídeos para facilitar a detecção.
Até o momento, a OpenAI não informou como treinou o Sora. Ao The New York Times, a empresa explicou apenas ter utilizado “vídeos disponíveis publicamente”, assim como “vídeos licenciados pelos detentores dos direitos autorais”.