Yakın geçmişte büyük dil modellerinin doğuşuyla birlikte, üzerinde eleştirel olarak tartıştığımız konulardan biri, yapay zeka sanatı, yapay zeka videoları vb. gibi yapay zeka tarafından oluşturulan içeriğin, içerik oluşturucuların yaratıcılığını yok edip etmeyeceği veya kaliteyi artırıp onlara yardımcı olup olmayacağıdır. Önceki blogumda , AI kod oluşturma araçlarının yazılım geliştirme döngüsüne nasıl değer katmaya yardımcı olabileceğinden bahsetmiştim. Bu yazıda esas olarak AI araçlarını kullanarak video içeriği oluşturmanın nasıl kolay ve hızlı değil aynı zamanda yaratıcı hale geldiğini vurgulayacağım. .
Yaratıcı ve ilgi çekici içerik üretmek için mevcut video ve görüntü modellerinden nasıl yararlanılabileceğini anlamadan önce, mevcut durumun nasıl göründüğünü anlamak önemlidir; mevcut AI video oluşturma ortamını aşağıdaki gibi katmanlandırabiliriz:
Adobe, Canva vb. gibi mevcut video editörleri yapay zekayı iş akışlarına entegre etmeye çalışıyor.
Fliki.ai, unscreen.com, synthesia.ai, hourone.ai vb. gibi yapay zeka tabanlı yeni çağ video düzenleme araçları.
Video oluşturma iş akışında tek kullanımlık duruma ayrılmış soyutlama katmanı , örneğin Midjourney videolar için gerçekçi görüntüler oluşturmaya yardımcı olur, RunwayML görüntüyü videoya veya görüntüyü görüntüye dönüştürmek için bir platform sağlar, Did görüntüye animasyon eklemeye yardımcı olur vb.
Tüm ortamın temelini oluşturan Model Katmanı , yazılım ekipleri kendi kullanım durumlarına göre özelleştirme yapmak için bu katmandan yararlanabilir.
Kullanım kolaylığı artarken özelleştirmek için katman esnekliğinde yukarıya doğru ilerledikçe, bu makalenin bağlamında, Soyutlama katmanını yaratıcı videolar oluşturmada nasıl kullanabileceğimizi anlamak için derinlemesine inceleyeceğiz, çünkü bu katman esnekliğin tam ortasında yer alıyor ve kullanım kolaylığı ve bir sanatçı olarak her iki dünyanın da en iyisine ihtiyaç vardır.
Soyutlama katmanındaki araçları kullanarak metinden videoya oluşturmak için bir boru hattını nasıl oluşturabileceğimizi öğrenmeden önce , videoyu oluşturmak için hangi adımların atılacağını ve her katmanda hangi araçların kullanılabileceğini belirlemek önemlidir.
AI metinden videoya dönüştürme aşağıdaki adımları içerir:
Yaptığım ilk adım, GPT'nin Hintçe senaryosunu her sahnede yer alan karakterler arasındaki diyaloglar şeklinde sunmasını sağlamak için birkaç çekim yapmaktı.
Giriş
Çıktı
Bu çok önemli bir adımdır ve sahne için senaryodan ayrılan görüntülerin oluşturulmasını içerir. Her şey Midjourney'in komut istemlerini kullanarak kendimizi ne kadar yaratıcı bir şekilde ifade edebildiğimizle ilgilidir; aşağıdaki örnekte Midjourney'e oluşturmak için verilen komuttan bahsedilmektedir. bir sahne için bir resim.
Hintli yaşlı Hindu azizinin Lord Cloud'dan yardım istediği sahnenin karikatürü; Lord bulut kişileşmiştir ve yüzünde mutluluk vardır, etrafındaki ortam kara bulutlu ve her tarafı aydınlatan ağaçlarla doludur
Görüntüye animasyon eklemeniz gerekirse, karakter hareketi ve sahne animasyonu eklemek için DiD veya RunwayML'i kullanabilirsiniz.
Bu adımda, on bir laboratuvar kullanarak anlatım için yapay zeka sesini oluşturabilirsiniz; genellikle bunlar, arkasında biraz robotik gibi görünse de ses üretme amacını çözen Metinden konuşmaya anlatım modelleridir, daha anlamlı ve gerçekçi hale getirilebilir. onbir laboratuvarın ücretli versiyonundan, bu hikaye için Ai4Bharat Metinden konuşmaya anlatımın harika bir iş çıkardığı Hintçe sesli anlatıma ihtiyacım vardı.
Bu, görüntüleri bir video düzenleyiciye eklemek ve sesi sahne ve anlatım zaman çizelgesine göre senkronize etmek için son ve en basit adımdır; Canva ve Adobe Express gibi araçlar burada harika iş çıkarır.
Yukarıda, birkaç temel araç kullanarak metinden hızlı bir şekilde nasıl video oluşturabileceğinizin en basit dökümü verilmiştir; örneğin, 16 benzersiz sahneden oluşan neredeyse ~ 3 dakikalık bir video oluşturdum, ödediğim zamanı ve parayı görmek ilginç olurdu. bu videoyu oluştur:
Yolculuk ortası maliyeti ~ 0,05 USD/resim - 16*0,05 = 0,8 USD
RunwayML ~ 0,02 USD/resim - 16*0,02 = 0,32
Canva ~ Premium eserleri kullanılmadığı için ücretsiz
Toplam Maliyet ~ 1$ /video
Bunu, 180 dakikalık oluşturma için ayda neredeyse 28 ABD doları ücret alan Fliki gibi yeni nesil yapay zeka video editörleriyle karşılaştırıldığında, yukarıda belirtilen video uzunluğu için ~ 0,5 ABD doları tutarında bir maliyet söz konusudur.
Yapay zeka tabanlı video düzenleyicilerde video oluşturmanın nihai maliyeti, Midjourney, RunwayML vb. araçların kullanılmasıyla ortaya çıkan toplam maliyetle karşılaştırıldığında daha az görünse de, ek maliyetle birlikte bu araçlar, bir video içeriği oluşturucuya esneklik ve yaratıcılık sağlar ve yardımcı olabilir. Justine'in de belirttiği gibi, Hollywood filmlerinin harika bir sahnesiyle karşılaştırılabilecek harika videolar oluştururken, öyle görünüyor ki, bu yapay zeka araçları video ajansının veya video prodüksiyon şirketlerinin iş akışıyla bir araya getirilebilir ve entegre edilebilirse, video prodüksiyonunda maksimum değer üretebilirler. Moore, bu başlıktaki Ortak @a16z da aynısını yansıtıyor.