paint-brush
"Kurosawa": um assistente de roteirista: limitações e referênciaspor@teleplay

"Kurosawa": um assistente de roteirista: limitações e referências

por Teleplay Technology 4m2024/05/23
Read on Terminal Reader

Muito longo; Para ler

Neste artigo, os pesquisadores apresentam o KUROSAWA, uma bancada de escrita de roteiros de IA para geração de enredos e roteiros, abordando a automação em mídia de entretenimento.
featured image - "Kurosawa": um assistente de roteirista: limitações e referências
Teleplay Technology  HackerNoon profile picture
0-item

Autores:

(1) Prerak Gandhi, Departamento de Ciência da Computação e Engenharia, Instituto Indiano de Tecnologia de Bombaim, Mumbai, [email protected], e esses autores contribuíram igualmente para este trabalho;

(2) Vishal Pramanik, Departamento de Ciência da Computação e Engenharia, Instituto Indiano de Tecnologia de Bombaim, Mumbai, vishalpramanik,[email protected], e esses autores contribuíram igualmente para este trabalho;

(3) Pushpak Bhattacharyya, Departamento de Ciência da Computação e Engenharia, Instituto Indiano de Tecnologia de Bombaim, Mumbai.

Tabela de Links

8. Limitações

• No conjunto de dados de geração de enredos, os enredos da Wikipédia às vezes não são escritos por escritores de conteúdo profissionais da indústria cinematográfica. Portanto, esses enredos podem não incluir os eventos principais do filme.


• Em alguns casos, o modelo não consegue gerar eventos coerentes juntamente com a introdução abrupta de personagens nas tramas e cenas.


• Embora tenha sido notado poucas vezes, o enredo ou cena gerada contém orações ou frases repetidas.


• O modelo alucina e gera coisas factualmente incorretas, tornando-o incapaz de gerar biografias ou documentários.


• O enredo ou cena pode não obedecer ao tema do input ou gênero mencionado junto com o prompt.

Referências

Selmer Bringsjord e David Ferrucci. 1999. Inteligência artificial e criatividade literária: Dentro da mente de Brutus, uma máquina de contar histórias. Imprensa de Psicologia.


Tom Brown, Benjamin Mann, Nick Ryder, Melanie Subbiah, Jared D Kaplan, Prafulla Dhariwal, Arvind Neelakantan, Pranav Shyam, Girish Sastry, Amanda Askell, e outros. 2020. Os modelos de linguagem são aprendizes rápidos. Avanços em sistemas de processamento de informação neural, 33:1877–1901.


Angela Fan, Mike Lewis e Yann Dauphin. 2018. Geração de histórias neurais hierárquicas. Pré-impressão do arXiv arXiv:1805.04833.


Angela Fan, Mike Lewis e Yann Dauphin. 2019. Estratégias para estruturação da geração de histórias. Pré-impressão do arXiv arXiv:1902.01109.


S. Campo. 1979. Roteiro: os fundamentos do roteiro. Um livro Delta. Editora Dell.


Chenyang Huang, Osmar R Zaiane, Amine Trabelsi e Nouha Dziri. 2018. Geração automática de diálogo com emoções expressas. Nos Anais da Conferência de 2018 do Capítulo Norte-Americano da Association for Computational Linguistics: Human Language Technologies, Volume 2 (Short Papers), páginas 49–54.


Ting-Hao Huang, Francis Ferraro, Nasrin Mostafazadeh, Ishan Misra, Aishwarya Agrawal, Jacob Devlin, Ross Girshick, Xiaodong He, Pushmeet Kohli, Dhruv Batra, e outros. 2016. Narrativa visual. Em Anais da conferência de 2016 do capítulo norte-americano da associação de linguística computacional: tecnologias de linguagem humana, páginas 1233–1239.


Parag Jain, Priyanka Agrawal, Abhijit Mishra, Mohak Sukhwani, Anirban Laha e Karthik Sankaranarayanan. 2017. Geração de histórias a partir de sequência de breves descrições independentes. Pré-impressão do arXiv arXiv:1707.05501.


Frederick Jelinek, Robert L. Mercer, Lalit R. Bahl e J. Baker. 1977. Perplexidade – uma medida da dificuldade das tarefas de reconhecimento de fala. Jornal da Sociedade Acústica da América, 62.


Mihir Kale e Abhinav Rastogi. 2020. Geração de texto guiada por modelo para diálogo orientado a tarefas. Pré-impressão do arXiv arXiv:2004.15006.


Jiwei Li, Will Monroe, Alan Ritter, Michel Galley, Jianfeng Gao e Dan Jurafsky. 2016. Aprendizagem por reforço profundo para geração de diálogo. Pré-impressão do arXiv arXiv:1606.01541.


Rensis Likert. 1932. Uma técnica para medir atitudes / por Rensis Likert. Arquivos de psicologia; não. 140. [sn], Nova York.


Chin-Yew Lin. 2004. ROUGE: Um pacote para avaliação automática de resumos. Em Text Summarization Branches Out, páginas 74–81, Barcelona, Espanha. Associação de Lingüística Computacional.


Kishore Papineni, Salim Roukos, Todd Ward e WeiJing Zhu. 2002. Bleu: um método para avaliação automática de tradução automática. Nos Anais da 40ª reunião anual da Association for Computational Linguistics, páginas 311–318.


Rafael PérezÝ Pérez e Mike Sharples. 2001. México: Um modelo computacional de um relato cognitivo da escrita criativa. Jornal de Inteligência Artificial Experimental e Teórica, 13(2):119–139.


Krishna Pillutla, Swabha Swayamdipta, Rowan Zellers, John Thickstun, Sean Welleck, Yejin Choi e Zaid Harchaoui. 2021. Mauve: Medindo a lacuna entre o texto neural e o texto humano usando fronteiras de divergência. Avanços em Sistemas de Processamento de Informação Neural, 34:4816–4828.


Hannah Rashkin, Asli Celikyilmaz, Yejin Choi e Jianfeng Gao. 2020. Plotmachines: Geração condicionada de contorno com rastreamento dinâmico do estado do gráfico. Pré-impressão do arXiv arXiv:2004.14967.


Mark O Riedl e Robert Michael Young. 2010. Planejamento narrativo: Equilibrando enredo e personagem. Jornal de Pesquisa de Inteligência Artificial, 39:217–268.


Jianheng Tang, Tiancheng Zhao, Chenyan Xiong, Xiaodan Liang, Eric Xing e Zhiting Hu. 2019. Conversa de domínio aberto guiada por alvo. Em Anais da 57ª Reunião Anual da Association for Computational Linguistics, páginas 5624–5634, Florença, Itália. Associação de Lingüística Computacional.


Zhe Wang, Wei He, Hua Wu, Haiyang Wu, Wei Li, Haifeng Wang e Enhong Chen. 2016. Geração de poesia chinesa com rede neural baseada em planejamento. Pré-impressão do arXiv arXiv:1610.09889.


Wenquan Wu, Zhen Guo, Xiangyang Zhou, Hua Wu, Xiyuan Zhang, Rongzhong Lian e Haifeng Wang. 2019. Conversa proativa entre homem e máquina com objetivo de conversa explícito. Em Anais da 57ª Reunião Anual da Association for Computational Linguistics, páginas 3794–3804, Florença, Itália. Associação de Lingüística Computacional.


Rui Yan. 2016. i, poeta: Composição automática de poesia por meio de redes neurais recorrentes com esquema de polimento iterativo. Em IJCAI, volume 2238, página 2244.


Zheng Zhao, Shay B Cohen e Bonnie Webber. 2020. Reduzindo alucinações quantitativas em resumos abstrativos. Pré-impressão do arXiv arXiv:2009.13312.


Yutao Zhu, Ruihua Song, Zhicheng Dou, Jian-Yun Nie e Jin Zhou. 2020. ScriptWriter: geração de script guiada por narrativa. Nos Anais da 58ª Reunião Anual da Association for Computational Linguistics, páginas 8647–8657, Online. Associação de Lingüística Computacional.


Este artigo está disponível no arxiv sob licença CC 4.0 DEED.