paint-brush
Metinden Videoya Üretim için AI Yığınıile@ratikeshmisra
2,079 okumalar
2,079 okumalar

Metinden Videoya Üretim için AI Yığını

ile Ratikesh4m2024/01/17
Read on Terminal Reader

Çok uzun; Okumak

Video içeriği oluşturmak için yapay zeka araçlarını kullanmak yalnızca kolay ve hızlı olmakla kalmıyor, aynı zamanda yaratıcı da oluyor. Bu yazıda, soyutlama katmanındaki araçları kullanarak metinden videoya oluşturmak için bir ardışık düzeni nasıl oluşturabileceğimizi öğreniyoruz.
featured image - Metinden Videoya Üretim için AI Yığını
Ratikesh HackerNoon profile picture
0-item
1-item

Yakın geçmişte büyük dil modellerinin doğuşuyla birlikte, üzerinde eleştirel olarak tartıştığımız konulardan biri, yapay zeka sanatı, yapay zeka videoları vb. gibi yapay zeka tarafından oluşturulan içeriğin, içerik oluşturucuların yaratıcılığını yok edip etmeyeceği veya kaliteyi artırıp onlara yardımcı olup olmayacağıdır. Önceki blogumda , AI kod oluşturma araçlarının yazılım geliştirme döngüsüne nasıl değer katmaya yardımcı olabileceğinden bahsetmiştim. Bu yazıda esas olarak AI araçlarını kullanarak video içeriği oluşturmanın nasıl kolay ve hızlı değil aynı zamanda yaratıcı hale geldiğini vurgulayacağım. .


Yaratıcı ve ilgi çekici içerik üretmek için mevcut video ve görüntü modellerinden nasıl yararlanılabileceğini anlamadan önce, mevcut durumun nasıl göründüğünü anlamak önemlidir; mevcut AI video oluşturma ortamını aşağıdaki gibi katmanlandırabiliriz:

AI Video Oluşturmada Katmanlar

  1. Adobe, Canva vb. gibi mevcut video editörleri yapay zekayı iş akışlarına entegre etmeye çalışıyor.

  2. Fliki.ai, unscreen.com, synthesia.ai, hourone.ai vb. gibi yapay zeka tabanlı yeni çağ video düzenleme araçları.

  3. Video oluşturma iş akışında tek kullanımlık duruma ayrılmış soyutlama katmanı , örneğin Midjourney videolar için gerçekçi görüntüler oluşturmaya yardımcı olur, RunwayML görüntüyü videoya veya görüntüyü görüntüye dönüştürmek için bir platform sağlar, Did görüntüye animasyon eklemeye yardımcı olur vb.

  4. Tüm ortamın temelini oluşturan Model Katmanı , yazılım ekipleri kendi kullanım durumlarına göre özelleştirme yapmak için bu katmandan yararlanabilir.


Kullanım kolaylığı artarken özelleştirmek için katman esnekliğinde yukarıya doğru ilerledikçe, bu makalenin bağlamında, Soyutlama katmanını yaratıcı videolar oluşturmada nasıl kullanabileceğimizi anlamak için derinlemesine inceleyeceğiz, çünkü bu katman esnekliğin tam ortasında yer alıyor ve kullanım kolaylığı ve bir sanatçı olarak her iki dünyanın da en iyisine ihtiyaç vardır.

Metinden videoya ardışık düzen oluşturma

Soyutlama katmanındaki araçları kullanarak metinden videoya oluşturmak için bir boru hattını nasıl oluşturabileceğimizi öğrenmeden önce , videoyu oluşturmak için hangi adımların atılacağını ve her katmanda hangi araçların kullanılabileceğini belirlemek önemlidir.



AI Video Oluşturma İş Akışı



AI metinden videoya dönüştürme aşağıdaki adımları içerir:

1. GPT istemlerini kullanarak komut dosyasından sahneler oluşturma


Yaptığım ilk adım, GPT'nin Hintçe senaryosunu her sahnede yer alan karakterler arasındaki diyaloglar şeklinde sunmasını sağlamak için birkaç çekim yapmaktı.


Giriş

Giriş


Çıktı


Çıktı


2. Sahnelerden görüntülerin oluşturulması

Bu çok önemli bir adımdır ve sahne için senaryodan ayrılan görüntülerin oluşturulmasını içerir. Her şey Midjourney'in komut istemlerini kullanarak kendimizi ne kadar yaratıcı bir şekilde ifade edebildiğimizle ilgilidir; aşağıdaki örnekte Midjourney'e oluşturmak için verilen komuttan bahsedilmektedir. bir sahne için bir resim.



Hintli yaşlı Hindu azizinin Lord Cloud'dan yardım istediği sahnenin karikatürü; Lord bulut kişileşmiştir ve yüzünde mutluluk vardır, etrafındaki ortam kara bulutlu ve her tarafı aydınlatan ağaçlarla doludur


Görüntü Oluşturma


3. Resme animasyon ekleme

Görüntüye animasyon eklemeniz gerekirse, karakter hareketi ve sahne animasyonu eklemek için DiD veya RunwayML'i kullanabilirsiniz.

4. Sahne anlatımı için yapay zeka sesinin oluşturulması

Bu adımda, on bir laboratuvar kullanarak anlatım için yapay zeka sesini oluşturabilirsiniz; genellikle bunlar, arkasında biraz robotik gibi görünse de ses üretme amacını çözen Metinden konuşmaya anlatım modelleridir, daha anlamlı ve gerçekçi hale getirilebilir. onbir laboratuvarın ücretli versiyonundan, bu hikaye için Ai4Bharat Metinden konuşmaya anlatımın harika bir iş çıkardığı Hintçe sesli anlatıma ihtiyacım vardı.

5. Video kliplerin birleştirilmesi ve sesin senkronize edilmesi

Bu, görüntüleri bir video düzenleyiciye eklemek ve sesi sahne ve anlatım zaman çizelgesine göre senkronize etmek için son ve en basit adımdır; Canva ve Adobe Express gibi araçlar burada harika iş çıkarır.

Video Prodüksiyonunun Kaba Maliyeti

Yukarıda, birkaç temel araç kullanarak metinden hızlı bir şekilde nasıl video oluşturabileceğinizin en basit dökümü verilmiştir; örneğin, 16 benzersiz sahneden oluşan neredeyse ~ 3 dakikalık bir video oluşturdum, ödediğim zamanı ve parayı görmek ilginç olurdu. bu videoyu oluştur:


Yolculuk ortası maliyeti ~ 0,05 USD/resim - 16*0,05 = 0,8 USD

RunwayML ~ 0,02 USD/resim - 16*0,02 = 0,32

Canva ~ Premium eserleri kullanılmadığı için ücretsiz

Toplam Maliyet ~ 1$ /video


Bunu, 180 dakikalık oluşturma için ayda neredeyse 28 ABD doları ücret alan Fliki gibi yeni nesil yapay zeka video editörleriyle karşılaştırıldığında, yukarıda belirtilen video uzunluğu için ~ 0,5 ABD doları tutarında bir maliyet söz konusudur.

Teklifi paketlemeniz gerekiyor

Yapay zeka tabanlı video düzenleyicilerde video oluşturmanın nihai maliyeti, Midjourney, RunwayML vb. araçların kullanılmasıyla ortaya çıkan toplam maliyetle karşılaştırıldığında daha az görünse de, ek maliyetle birlikte bu araçlar, bir video içeriği oluşturucuya esneklik ve yaratıcılık sağlar ve yardımcı olabilir. Justine'in de belirttiği gibi, Hollywood filmlerinin harika bir sahnesiyle karşılaştırılabilecek harika videolar oluştururken, öyle görünüyor ki, bu yapay zeka araçları video ajansının veya video prodüksiyon şirketlerinin iş akışıyla bir araya getirilebilir ve entegre edilebilirse, video prodüksiyonunda maksimum değer üretebilirler. Moore, bu başlıktaki Ortak @a16z da aynısını yansıtıyor.




Justine Moore