tác giả:
(1) Prerak Gandhi, Khoa Khoa học và Kỹ thuật Máy tính, Viện Công nghệ Ấn Độ Bombay, Mumbai, [email protected], và các tác giả này đã đóng góp như nhau cho công việc này;
(2) Vishal Pramanik, Khoa Khoa học và Kỹ thuật Máy tính, Viện Công nghệ Ấn Độ Bombay, Mumbai, vishalpramanik,[email protected], và các tác giả này đã đóng góp như nhau cho công việc này;
(3) Pushpak Bhattacharyya, Khoa Khoa học và Kỹ thuật Máy tính, Viện Công nghệ Ấn Độ Bombay, Mumbai.
Trong bài báo này, chúng tôi đã báo cáo một công trình đầu tiên về tạo cốt truyện và kịch bản tự động từ lời nhắc. Đánh giá tự động, xếp hạng con người bằng thang đo Likert và quan sát định tính của những người viết kịch bản chuyên nghiệp từ đối tác trong ngành của chúng tôi (một nền tảng truyền thông lớn và có uy tín) - tất cả đều chứng minh sức mạnh của tập dữ liệu phong phú của chúng tôi và GPT3 trong việc tạo tập lệnh. Chúng tôi hy vọng công việc của mình sẽ giúp ích cho những người viết chương trình truyền hình, người viết chương trình trò chơi, v.v.
Có một số hướng đi trong tương lai: (i) sự mất cân bằng trong bộ dữ liệu cốt truyện Bollywood cần được khắc phục; (ii) có nhiều biến thể trong chữ viết Ấn Độ do tính đa ngôn ngữ, cần được giải quyết; (iii) điểm yếu rõ ràng nhất của GPT-3 là không xử lý được dữ liệu và con số thực tế, gây ảo giác và cản trở việc tự động tạo phim tài liệu, tiểu sử. Dù sao thì việc phát hiện và giải quyết ảo giác cũng là nhu cầu ngày càng tăng đối với các mô hình ngôn ngữ.
Bài viết này có sẵn trên arxiv theo giấy phép CC 4.0 DEED.