OpenAI elevou a IA generativa a novos patamares com Sora, seu novo modelo de texto para vídeo que pode gerar cenas realistas apenas a partir de instruções escritas. Embora o DALL-E e outros modelos de texto para imagem nos tenham mostrado o poder da geração de IA, Sora demonstra o quão longe chegamos ao adicionar o elemento de movimento.
Estaremos testando o modelo Sora assim que estiver no ar e talvez até lançaremos um guia gratuito em nosso boletim informativo semanal - 'AI Hunters' ! Não perca as novas plataformas e eventos inovadores de IA!
Além de imagens estáticas, Sora pode gerar vídeos de até um minuto. Ele também pode pegar vídeos existentes e preencher os quadros ausentes para aprimorar o conteúdo. As possibilidades de criação são infinitas – poderemos ver curtas-metragens, animações ou mesmo replays esportivos aprimorados gerados por IA no futuro.
Mas o que é verdadeiramente impressionante em Sora é a sua compreensão do mundo físico. Pode simular cenas complexas envolvendo vários personagens e movimentos. Quer ver alguém caminhando por uma floresta com folhas realistas farfalhando e a luz do sol filtrando-se pelas árvores? Sora cuida de você.
Nos bastidores, Sora aproveita trabalhos anteriores em modelos de difusão e transformadores. As etapas aleatórias de um modelo de difusão são excelentes na geração de dados de alta dimensão, como vídeos. Enquanto isso, os transformadores lidam com tarefas sequenciais de processamento de dados, como linguagem natural.
Claro, ainda existem algumas limitações. Simular física complexa, como acidentes de carro ou mergulhos em penhascos, é difícil. O modelo também luta com causa e efeito – não espere que mordidas de biscoito apareçam magicamente depois que alguém dá uma mordida!
Naturalmente, o OpenAI está focado na segurança. Antes do lançamento público, eles estão aprimorando técnicas para filtrar conteúdo prejudicial ou enganoso. O progresso requer um equilíbrio delicado - Sora deve gerar de forma realista, evitando qualquer coisa inadequada.
Por enquanto, a empresa implementou as seguintes medidas de segurança:
Restrições de conteúdo: OpenAI estabeleceu diretrizes de conteúdo rígidas para Sora, semelhantes às existentes para seu modelo DALL-E 3. Estas diretrizes proíbem a geração de conteúdo violento, sexual ou de ódio, bem como a apropriação da imagem de pessoas reais ou do estilo de artistas nomeados.
Metadados e identificação de proveniência: Para promover transparência e responsabilidade, a OpenAI planeja fornecer metadados de proveniência para vídeos gerados por Sora. Além disso, a empresa permitirá que os espectadores identifiquem o conteúdo criado pelo modelo de IA.
Red Teaming e acesso limitado: OpenAI concedeu acesso ao Sora a um seleto grupo de pesquisadores, artistas visuais e cineastas que farão uma "equipe vermelha" do produto, testando-o quanto à suscetibilidade de contornar os termos de serviço da empresa. Este acesso limitado permite à OpenAI recolher feedback e identificar riscos potenciais antes de tornar o modelo mais amplamente disponível.
Envolvimento com formuladores de políticas e artistas: A empresa está ativamente envolvida com formuladores de políticas, educadores e artistas para compreender as preocupações e identificar casos de uso positivos para o modelo. Esta abordagem proativa demonstra o compromisso da OpenAI em abordar as implicações sociais mais amplas da sua tecnologia.
À medida que a IA generativa avança, modelos como o Sora têm potencial para revolucionar a criação e o consumo de conteúdo. Eles poderiam gerar conteúdo personalizado, ajudar-nos a compreender o mundo e potencializar mundos virtuais realistas.
No entanto, é crucial que estes modelos sejam desenvolvidos de forma responsável, considerando os riscos dos conteúdos gerados pela IA. A OpenAI está tomando medidas importantes com o Sora para maximizar seus benefícios e, ao mesmo tempo, mitigar possíveis problemas.