ओपनएआई ने अपने नए टेक्स्ट-टू-वीडियो मॉडल सोरा के साथ जेनरेटिव एआई को नई ऊंचाइयों पर ले लिया है, जो केवल लिखित निर्देशों से यथार्थवादी दृश्य उत्पन्न कर सकता है। जबकि DALL-E और अन्य टेक्स्ट-टू-इमेज मॉडल ने हमें AI पीढ़ी की शक्ति दिखाई है, सोरा गति के तत्व को जोड़कर दर्शाता है कि हम कितनी दूर आ गए हैं।
हम सोरा मॉडल के लाइव होने पर उसका परीक्षण करेंगे और हो सकता है कि हम अपने साप्ताहिक समाचार पत्र - 'एआई हंटर्स' पर एक निःशुल्क मार्गदर्शिका भी जारी करें! नए एआई अभूतपूर्व प्लेटफ़ॉर्म और ईवेंट को न चूकें!
स्थिर छवियों से परे, सोरा एक मिनट तक लंबे वीडियो तैयार कर सकता है। यह मौजूदा वीडियो भी ले सकता है और सामग्री को बढ़ाने के लिए छूटे हुए फ़्रेमों को भर सकता है। सृजन की संभावनाएं अनंत हैं - हम भविष्य में एआई-जनित लघु फिल्में, एनिमेशन, या यहां तक कि उन्नत खेल रीप्ले भी देख सकते हैं।
लेकिन सोरा के बारे में जो बात वास्तव में प्रभावशाली है वह भौतिक दुनिया के बारे में उसकी समझ है। यह कई पात्रों और गतियों वाले जटिल दृश्यों का अनुकरण कर सकता है। क्या आप किसी को जंगल में घूमते हुए यथार्थवादी पत्तों की सरसराहट और पेड़ों से छनती सूरज की रोशनी के बीच देखना चाहते हैं? सोरा ने आपको कवर कर लिया है।
हुड के तहत, सोरा प्रसार मॉडल और ट्रांसफार्मर पर पिछले काम का लाभ उठाता है। एक प्रसार मॉडल के यादृच्छिक चरण वीडियो जैसे उच्च-आयामी डेटा उत्पन्न करने में उत्कृष्टता प्राप्त करते हैं। इस बीच, ट्रांसफार्मर प्राकृतिक भाषा की तरह अनुक्रमिक डेटा प्रोसेसिंग कार्यों को संभालते हैं।
बेशक, अभी भी कुछ सीमाएँ हैं। कार दुर्घटना या चट्टान से गोता लगाने जैसी जटिल भौतिकी का अनुकरण करना कठिन साबित होता है। मॉडल कारण और प्रभाव के साथ भी संघर्ष करता है - यह उम्मीद न करें कि किसी के काटने के बाद कुकी बाइट्स जादुई रूप से प्रकट होंगी!
स्वाभाविक रूप से, OpenAI सुरक्षा पर केंद्रित है। सार्वजनिक रिलीज़ से पहले, वे हानिकारक या भ्रामक सामग्री को फ़िल्टर करने की तकनीकों को बढ़ा रहे हैं। प्रगति के लिए एक नाजुक संतुलन की आवश्यकता होती है - सोरा को किसी भी अनुचित चीज़ से बचते हुए यथार्थवादी ढंग से काम करना चाहिए।
अभी के लिए, कंपनी ने निम्नलिखित सुरक्षा उपाय किए हैं:
सामग्री प्रतिबंध: ओपनएआई ने सोरा के लिए अपने DALL-E 3 मॉडल के समान सख्त सामग्री दिशानिर्देश स्थापित किए हैं। ये दिशानिर्देश हिंसक, यौन या घृणित सामग्री के निर्माण के साथ-साथ वास्तविक लोगों की समानता या नामित कलाकारों की शैली के विनियोग पर रोक लगाते हैं।
उद्गम मेटाडेटा और पहचान: पारदर्शिता और जवाबदेही को बढ़ावा देने के लिए, ओपनएआई ने सोरा द्वारा उत्पन्न वीडियो के लिए उद्गम मेटाडेटा प्रदान करने की योजना बनाई है। इसके अतिरिक्त, कंपनी दर्शकों को एआई मॉडल द्वारा बनाई गई सामग्री की पहचान करने में सक्षम बनाएगी।
रेड टीमिंग और सीमित पहुंच: ओपनएआई ने शोधकर्ताओं, दृश्य कलाकारों और फिल्म निर्माताओं के एक चुनिंदा समूह को सोरा तक पहुंच प्रदान की है जो उत्पाद को "रेड टीम" करेंगे, कंपनी की सेवा की शर्तों को दरकिनार करने की संवेदनशीलता के लिए इसका परीक्षण करेंगे। यह सीमित पहुंच ओपनएआई को मॉडल को अधिक व्यापक रूप से उपलब्ध कराने से पहले फीडबैक इकट्ठा करने और संभावित जोखिमों की पहचान करने की अनुमति देती है।
नीति निर्माताओं और कलाकारों के साथ जुड़ाव: कंपनी चिंताओं को समझने और मॉडल के लिए सकारात्मक उपयोग के मामलों की पहचान करने के लिए नीति निर्माताओं, शिक्षकों और कलाकारों के साथ सक्रिय रूप से जुड़ रही है। यह सक्रिय दृष्टिकोण अपनी प्रौद्योगिकी के व्यापक सामाजिक निहितार्थों को संबोधित करने के लिए ओपनएआई की प्रतिबद्धता को दर्शाता है।
जैसे-जैसे जेनेरिक एआई आगे बढ़ रहा है, सोरा जैसे मॉडलों में सामग्री निर्माण और उपभोग में क्रांति लाने की क्षमता है। वे वैयक्तिकृत सामग्री तैयार कर सकते हैं, हमें दुनिया को समझने में मदद कर सकते हैं और यथार्थवादी आभासी दुनिया को शक्ति प्रदान कर सकते हैं।
हालाँकि, यह महत्वपूर्ण है कि एआई-जनित सामग्री के जोखिमों को ध्यान में रखते हुए इन मॉडलों को जिम्मेदारी से विकसित किया जाए। ओपनएआई संभावित मुद्दों को कम करते हुए अपने लाभों को अधिकतम करने के लिए सोरा के साथ महत्वपूर्ण कदम उठा रहा है।