हाल के दिनों में बड़े भाषा मॉडलों की उत्पत्ति के साथ, एक बात जिस पर हम गंभीर रूप से बहस करते हैं वह यह है कि क्या   जैसे AI कला, AI वीडियो आदि सामग्री निर्माताओं की रचनात्मकता को नष्ट कर देगी या गुणवत्ता बढ़ा सकती है और उनकी सहायता कर सकती है। अपने   में, मैंने इस बारे में बात की थी कि एआई कोड-जनरेशन टूल सॉफ्टवेयर विकास चक्र में मूल्य जोड़ने में कैसे मदद कर सकते हैं, इस पोस्ट में मैं मुख्य रूप से इस बात पर प्रकाश डालूंगा कि कैसे एआई टूल का उपयोग करके वीडियो सामग्री बनाना न केवल आसान और तेज़ हो रहा है बल्कि रचनात्मक भी हो रहा है। . AI-जनित सामग्री पिछले ब्लॉग  यह समझने से पहले कि कोई रचनात्मक और आकर्षक सामग्री तैयार करने में वर्तमान वीडियो और छवि मॉडल का लाभ कैसे उठा सकता है, यह समझना महत्वपूर्ण है कि वर्तमान स्थिति कैसी दिखती है, हम वर्तमान एआई वीडियो पीढ़ी परिदृश्य को नीचे के रूप में परत कर सकते हैं:    मौजूदा वीडियो संपादक Adobe, Canva आदि जैसे AI को अपने वर्कफ़्लो में एकीकृत करने का प्रयास कर रहे हैं।    जैसे Fliki.ai, unscreen.com, synthesia.ai, Hourone.ai, आदि। AI-आधारित नए जमाने के वीडियो संपादन उपकरण  वीडियो जनरेशन वर्कफ़्लो में एकल उपयोग के मामले के लिए समर्पित   , उदाहरण के लिए   वीडियो के लिए यथार्थवादी छवियां बनाने में मदद करती है,   छवि को वीडियो या छवि को छवि में बदलने के लिए एक मंच प्रदान करता है,   छवि में एनीमेशन जोड़ने में मदद करता है, इत्यादि। अमूर्त परत मिडजॉर्नी रनवेएमएल डिड    जो संपूर्ण परिदृश्य का आधार बनाती है, सॉफ़्टवेयर टीमें अपने उपयोग के मामलों को अनुकूलित करने के लिए इस परत का लाभ उठा सकती हैं। मॉडल परत  जैसे-जैसे हम कस्टमाइज़ करने के लिए परत के लचीलेपन में ऊपर जाते हैं, जबकि उपयोग में आसानी बढ़ती है, इस लेख के संदर्भ में हम यह समझने के लिए गहराई से गोता लगाएंगे कि हम रचनात्मक वीडियो बनाने में   उपयोग कैसे कर सकते हैं क्योंकि यह परत लचीलेपन के बीच में आती है और उपयोग में आसानी, और एक कलाकार के रूप में व्यक्ति को दोनों दुनियाओं के सर्वश्रेष्ठ की आवश्यकता होती है। एब्स्ट्रैक्शन परत का  टेक्स्ट-टू-वीडियो पाइपलाइन का निर्माण    हम सीखें कि हम अमूर्त परत में टूल का उपयोग करके   उत्पन्न करने के लिए एक पाइपलाइन कैसे बना सकते हैं, यह तय करना महत्वपूर्ण है कि वीडियो उत्पन्न करने के लिए चरण क्या होंगे और प्रत्येक परत में कौन से टूल का उपयोग किया जा सकता है।  इससे पहले कि टेक्स्ट-टू-वीडियो  AI टेक्स्ट-टू-वीडियो जेनरेशन में निम्नलिखित चरण शामिल हैं:  1. GPT संकेतों का उपयोग करके स्क्रिप्ट से दृश्य उत्पन्न करना  मैंने जो पहला कदम उठाया, वह जीपीटी को प्रत्येक दृश्य में शामिल पात्रों के बीच संवादों के रूप में हिंदी स्क्रिप्ट देने के लिए प्रेरित करना था।     इनपुट     उत्पादन  2. दृश्यों से छवियाँ उत्पन्न करना  यह महत्वपूर्ण कदम है और इसमें उस दृश्य के लिए चित्र बनाना शामिल है जिसे स्क्रिप्ट से तोड़ दिया गया था, यह सब इस बात पर निर्भर करता है कि हम   के त्वरित दिशानिर्देशों का उपयोग करके खुद को कितनी रचनात्मक रूप से अभिव्यक्त कर सकते हैं, नीचे दिए गए उदाहरण में मिडजर्नी को उत्पन्न करने के लिए दिए गए संकेत का उल्लेख है एक दृश्य के लिए एक छवि. मिडजर्नी     दृश्य का एक कार्टून जहां भारतीय वृद्ध हिंदू संत लॉर्ड क्लाउड से मदद मांग रहे हैं; भगवान मेघ साक्षात हैं और उनके चेहरे पर प्रसन्नता है, चारों ओर काले बादलों और बिजली की चमक के साथ चारों ओर का वातावरण पेड़ों से भरा है  3. छवि में एनीमेशन जोड़ना  यदि आपको छवि में एनीमेशन जोड़ने की आवश्यकता है तो आप चरित्र गति और दृश्य एनीमेशन जोड़ने के लिए   या   का उपयोग कर सकते हैं। DiD RunwayML  4. दृश्य वर्णन के लिए एआई आवाज उत्पन्न करना  इस चरण में, आप ग्यारह प्रयोगशालाओं का उपयोग करके कथन के लिए एआई आवाज उत्पन्न कर सकते हैं, आम तौर पर, ये टेक्स्ट टू स्पीच वर्णन मॉडल हैं जिनके पीछे का उपयोग थोड़ा रोबोटिक लग सकता है लेकिन आवाज उत्पन्न करने के उद्देश्य को हल कर सकता है, कोई इसे अधिक अभिव्यंजक और यथार्थवादी बना सकता है ग्यारह प्रयोगशालाओं से भुगतान किए गए संस्करण में, इस कहानी के लिए मुझे हिंदी वॉयस नैरेशन की आवश्यकता थी जिसके लिए   नैरेशन बहुत अच्छा काम करता है। Ai4भारत टेक्स्ट टू स्पीच  5. वीडियो क्लिप सिलना और आवाज को सिंक करना  यह वीडियो संपादक में छवियों को जोड़ने और दृश्य और कथन समयरेखा के अनुसार आवाज को सिंक करने का अंतिम और सरल कदम है, कैनवा और एडोब एक्सप्रेस जैसे उपकरण यहां बहुत अच्छा काम करते हैं।  वीडियो निर्माण की अनुमानित लागत  ऊपर सबसे सरल विवरण दिया गया है कि आप कुछ बुनियादी टूल का उपयोग करके टेक्स्ट से वीडियो कैसे जल्दी से तैयार कर सकते हैं, मेरे उदाहरण के लिए, मैंने 16 अद्वितीय दृश्यों के साथ लगभग ~ 3 मिनट का वीडियो तैयार किया, यह देखना दिलचस्प होगा कि मैंने कितना समय और पैसा चुकाया यह वीडियो बनाएं:  मध्य यात्रा लागत ~ $0.05/छवि - 16*0.05 = $0.8  रनवेएमएल ~ $0.02/छवि - 16*0.02 = 0.32  कैनवा ~ नि:शुल्क है क्योंकि उन्होंने अपनी प्रीमियम कलाकृतियों का उपयोग नहीं किया है   कुल लागत ~$1/वीडियो  इसकी तुलना   जैसे नए जमाने के एआई वीडियो संपादकों से करें, जो 180 मिनट के निर्माण के लिए लगभग $28/माह का शुल्क लेते हैं, जिसकी   होगी। फ्लिकी लागत ऊपर उल्लिखित वीडियो लंबाई के लिए ~ $0.5  प्रसाद को बंडल करने की आवश्यकता है  यद्यपि एआई-आधारित वीडियो संपादकों में वीडियो बनाने की अंतिम लागत मिडजर्नी, रनवेएमएल इत्यादि जैसे टूल का उपयोग करके की गई कुल लागत की तुलना में कम लगती है, अतिरिक्त लागत के साथ ये टूल वीडियो सामग्री निर्माता को लचीलापन और रचनात्मकता प्रदान करते हैं और मदद कर सकते हैं कुछ अद्भुत वीडियो तैयार करने में जिनकी तुलना हॉलीवुड फिल्म के एक अद्भुत दृश्य से की जा सकती है, ऐसा लगता है कि अगर इन एआई उपकरणों को वीडियो एजेंसी या वीडियो प्रोडक्शन हाउस के वर्कफ़्लो के साथ बंडल और एकीकृत किया जा सकता है तो वे वीडियो उत्पादन में अधिकतम मूल्य उत्पन्न कर सकते हैं, जैसा कि जस्टिन ने कहा है   थ्रेड में पार्टनर   मूर भी यही दर्शाते हैं।  इस @a16z

Walkthroughs, tutorials, guides, and tips. This story will teach you how to do something new or how to do something better.

This story will praise and/or roast a product, company, service, game, or anything else people like to review on the Internet.

Newsletter

यह ऑडियो कहानी की मूल भाषा में निर्मित है!

टेक्स्ट-टू-वीडियो जेनरेशन के लिए एआई स्टैक

About Author

टिप्पणियाँ

लेबल

इस लेख में चित्रित किया गया था

Related Stories

उपयोगकर्ता-केंद्रित क्रिप्टो उत्पाद बनाना: ग्राहक प्रतिक्रिया का महत्व

टेलीग्राम: क्रिप्टो द्वीप का मुख्य भूमि से पुल

He/Him/Master of Discovery

सफल क्लाउड माइग्रेशन के लिए संपूर्ण गाइड: रणनीतियाँ और सर्वोत्तम अभ्यास

उपयोगकर्ता-केंद्रित क्रिप्टो उत्पाद बनाना: ग्राहक प्रतिक्रिया का महत्व

टेलीग्राम: क्रिप्टो द्वीप का मुख्य भूमि से पुल

He/Him/Master of Discovery

सफल क्लाउड माइग्रेशन के लिए संपूर्ण गाइड: रणनीतियाँ और सर्वोत्तम अभ्यास

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps