इस सप्ताह का पेपर आज तक का आपका अगला पसंदीदा मॉडल हो सकता है। अगर आपको लगता है कि या जैसे हालिया इमेज जेनरेशन मॉडल अच्छे हैं, तो आपको विश्वास नहीं होगा कि यह कितना अविश्वसनीय है। डेल स्टेबल डिफ्यूजन "यह वाला" इमेजिक है। इमेजिक एक ऐसा प्रसार-आधारित मॉडल लेता है जो पाठ लेने और उसमें से छवियां उत्पन्न करने में सक्षम होता है और छवियों को संपादित करने के लिए मॉडल को अनुकूलित करता है। बस इसे देखें... आप एक छवि बना सकते हैं और फिर मॉडल को अपनी इच्छानुसार इसे संपादित करना सिखा सकते हैं। नीचे दिए गए वीडियो में और जानें... सन्दर्भ: पूरा लेख पढ़ें: कावर, बी., ज़ादा, एस., लैंग, ओ., तोव, ओ., चांग, एच., डेकेल, टी., मोसेरी, आई. और ईरानी, एम., 2022. इमेजिक: टेक्स्ट-आधारित वास्तविक छवि प्रसार मॉडल के साथ संपादन। arXiv प्रीप्रिंट arXiv:2210.09276। ► इसे स्थिर प्रसार के साथ प्रयोग करें: ►माई न्यूज़लेटर (आपके ईमेल पर साप्ताहिक रूप से समझाया गया एक नया AI एप्लिकेशन!): https://www.louisbouchard.ai/imagic/ https://github.com/justinpinkney/stable-diffusion/blob/main/notebooks/imgic.ipynb https://www.louisbouchard.ai/newsletter/ वीडियो प्रतिलेख 0:24 देखें कि आप एक छवि उत्पन्न कर सकते हैं 0:26 और फिर मॉडल को किसी भी तरह संपादित करना सिखाएं 0:29 जिस तरह से आप चाहते हैं यह एक बहुत बड़ा कदम है 0:31 अपना खुद का फोटोशॉप रखने की दिशा में 0:33 डिजाइनर मुफ्त में न केवल मॉडल 0:36 समझता है कि आप क्या दिखाना चाहते हैं लेकिन 0:38 यह यथार्थवादी भी रहने में सक्षम है 0:41 प्रारंभिक के गुणों को रखने के रूप में 0:43 छवियां बस देखती हैं कि कुत्ता कैसे रहता है 0:46 सभी छवियों में समान यहाँ यह कार्य है 0:49 टेक्स्ट कंडीशन्ड इमेज एडिटिंग कहा जाता है 0:51 इसका मतलब है कि केवल उपयोग करके छवियों को संपादित करना 0:54 पाठ और एक प्रारंभिक छवि जो थी 0:57 बहुत असंभव एक साल भी नहीं 0:59 पहले अब देखो यह क्या कर सकता है हाँ यह 1:03 सभी एक ही इनपुट छवि से किया जाता है 1:05 और एक छोटा वाक्य जहाँ आप देखते हैं क्या 1:07 आप चाहते हैं कि यह कितना अद्भुत है 1:09 केवल एक चीज और भी कूलर है कि यह कैसा है 1:12 काम करता है चलो इसमें गोता लगाएँ लेकिन पहले अगर 1:15 आप वर्तमान में AI सीख रहे हैं या करना चाहते हैं 1:17 इसे सीखना शुरू करें आपको यह पसंद आएगा 1:19 अवसर मुझे पता है कि यह कितना कठिन हो सकता है 1:22 एआई सीखते समय वास्तविक प्रगति करें 1:24 कभी-कभी अतिरिक्त संरचना और 1:26 जवाबदेही वह हो सकती है जो आपको प्रस्तावित करती है 1:29 अगला स्तर अगर वह आपके जैसा लगता है 1:31 इस वीडियो के प्रायोजक में शामिल हों डेल्टा 1:33 डेल्टा अकादमी में अकादमी जो आप सीखते हैं 1:36 खेल का निर्माण करके सुदृढीकरण सीखना 1:38 लाइव कोहोर्ट में AIS शून्य से तक जाता है 1:41 निर्यात के माध्यम से अल्फागो तैयार किया गया 1:43 इंटरैक्टिव ट्यूटोरियल लाइव चर्चा 1:46 इन विशेषज्ञों और साप्ताहिक AI . के साथ 1:48 प्रतियोगिताओं का निर्माण यह सिर्फ नहीं है 1:51 एक और कोर्स स्पैम वेबसाइट यह तीव्र है 1:53 हाथ पर और उच्च गुणवत्ता पर ध्यान केंद्रित 1:56 डीपमाइंड ऑक्सफ़ोर्ड के विशेषज्ञों द्वारा डिज़ाइन किया गया 1:58 और कैम्ब्रिज यह वह जगह है जहाँ कोडर जाते हैं 2:01 फ्यूचर प्रूफ उनके कैरियर से 2:03 एआई के अग्रिम और मज़े के साथ-साथ a 2:06 साथियों और विशेषज्ञों का लाइव समुदाय 2:08 आगे बढ़ाओ तुम आइकोनिक लिखोगे 2:10 dqn से लेकर पायथन में एल्गोरिदम 2:13 अल्फ़ागो अब तक के सबसे अच्छे कार्यक्रमों में से एक है 2:16 नीचे दिए गए मेरे लिंक के माध्यम से अब उनसे जुड़ें 2:18 और प्रोमो कोड का उपयोग करें जो एआई प्राप्त करने के लिए है 2:21 10% की छूट 2:23 तो iMagic कैसे काम करता है जैसा कि हमने कहा था 2:26 संपादित करने के लिए एक छवि और एक कैप्शन लेता है 2:29 छवि सेट करें और आप उत्पन्न भी कर सकते हैं 2:31 इसके कई रूपांतर इस मॉडल 2:33 कागजों के विशाल बहुमत की तरह 2:35 जो इन दिनों रिलीज हो रहे हैं, वह किस पर आधारित है? 2:38 प्रसार मॉडल अधिक विशेष रूप से यह 2:41 एक छवि जनरेटर मॉडल लेता है जो था 2:43 से चित्र बनाने के लिए पहले से ही प्रशिक्षित 2:45 पाठ और इसे छवि संपादन के लिए अनुकूलित करता है 2:48 उनके मामले में यह Imogen का उपयोग करता है जो I 2:51 पिछले वीडियो में कवर किया गया यह एक है 2:53 प्रसार आधारित जनरेटिव मॉडल सक्षम 2:55 के बाद उच्च परिभाषा चित्र बनाएं 2:57 के विशाल डेटा सेट पर प्रशिक्षित किया जा रहा है 3:00 के मामले में छवि कैप्शन जोड़े 3:02 iMagic वे बस इसे पूर्व-प्रशिक्षित लेते हैं 3:05 बेसलाइन के रूप में इमेजन मॉडल और मेक 3:08 संपादित करने के लिए इसमें संशोधन 3:10 छवि को ध्यान में रखते हुए इनपुट के रूप में भेजी गई छवियां 3:13 विशिष्ट उपस्थिति जैसे कि कुत्ते का 3:16 दौड़ और पहचान और इसे संपादित करना 3:18 हमारे पाठ के बाद शुरू करने के लिए हमारे पास है 3:21 पाठ और प्रारंभिक दोनों को एन्कोड करने के लिए 3:23 इमेज एज ताकि इसे समझा जा सके 3:25 हमारे इमेजिंग मॉडल द्वारा जब यह किया जाता है 3:28 हम अपने टेक्स्ट एन्कोडिंग को अनुकूलित करते हैं हमारे टेक्स्ट 3:31 हमारे प्रारंभिक को बेहतर ढंग से फिट करने के लिए एम्बेडिंग 3:33 छवि मूल रूप से हमारा पाठ ले रही है 3:35 प्रतिनिधित्व और इसे हमारे लिए अनुकूलित करें 3:38 प्रारंभिक छवि जिसे ई ऑप्टिमाइज़ कहा जाता है 3:41 यकीन है कि यह समझता है कि इस उदाहरण में 3:43 हम एक ही तरह का उत्पन्न करना चाहते हैं 3:45 एक समान दिखने वाले पक्षी के साथ छवि और 3:48 पृष्ठभूमि तो हम अपना पूर्व-प्रशिक्षित लेते हैं 3:51 छवि जनरेटर को ठीक करने के लिए इसका अर्थ है 3:53 कि हम छवि और मॉडल को फिर से प्रशिक्षित करेंगे 3:55 हम अनुकूलित पाठ एम्बेडिंग रखते हुए 3:58 बस एक ही उत्पादन किया तो ये दोनों 4:01 टेक्स्ट एम्बेडिंग प्राप्त करने के लिए चरणों का उपयोग किया जाता है 4:03 छवि एम्बेडिंग के करीब 4:06 दोनों में से एक को फ्रीज करना और प्राप्त करना 4:08 अन्य करीब जो यह सुनिश्चित करेगा कि हम 4:10 टेक्स्ट और इनिशियल दोनों के लिए ऑप्टिमाइज़ करें 4:12 छवि न केवल दो में से एक अब कि 4:15 हमारा मॉडल प्रारंभिक छवि को समझता है 4:17 हमारे पाठ में और समझते हैं कि वे 4:19 समान हैं हमें इसे सिखाने की आवश्यकता है 4:21 इसके लिए नई छवि विविधताएं उत्पन्न करें 4:24 पाठ यह चिंगारी सुपर सरल है हमारा पाठ 4:27 एम्बेडिंग और छवि अनुकूलित 4:29 एम्बेडिंग बहुत समान हैं लेकिन फिर भी 4:32 ठीक वही नहीं जो हम करते हैं 4:34 यहाँ है कि हम छवि एम्बेडिंग लेते हैं 4:36 हमारे एन्कोडेड स्थान में और इसे थोड़ा स्थानांतरित करें 4:39 इस समय एम्बेड किए गए पाठ की ओर 4:42 यदि आप iMagic मॉडल को जेनरेट करने के लिए कहते हैं 4:45 अनुकूलित पाठ का उपयोग कर एक छवि it 4:47 आपको वही छवि देनी चाहिए जो आपकी 4:49 इनपुट छवि इसलिए यदि आप एम्बेडिंग को स्थानांतरित करते हैं 4:52 आपके टेक्स्ट को एम्बेड करने की ओर थोड़ा सा 4:55 छवि को थोड़ा सा संपादित भी करेगा 4:58 आप क्या चाहते हैं जितना अधिक आप इसे अंदर ले जाते हैं 5:00 यह स्थान जितना बड़ा संपादन होगा 5:02 और जितनी दूर से तुम पाओगे 5:05 आपकी प्रारंभिक छवि तो केवल एक चीज आप 5:07 अब यह पता लगाने की जरूरत है कि का आकार क्या है 5:10 यह कदम आप अपनी ओर ले जाना चाहते हैं 5:12 पाठ और वॉइला जब आप अपना . पाते हैं 5:15 सही संतुलन आपके पास एक नया मॉडल है 5:17 के रूप में कई विविधताएं उत्पन्न करने में सक्षम 5:20 आप महत्वपूर्ण छवि को संरक्षित करना चाहते हैं 5:22 रास्ता संपादित करते समय विशेषता दृश्य 5:25 आप चाहते हैं कि निश्चित रूप से परिणाम नहीं हैं 5:27 बिल्कुल सही जैसा कि आप यहाँ देख सकते हैं जहाँ 5:30 मॉडल या तो ठीक से संपादित नहीं करता है 5:32 या यादृच्छिक छवि संशोधन करता है 5:35 प्रारंभिक छवि जैसे क्रॉप करना or 5:37 अनुपयुक्त रूप से ज़ूम करना अभी भी रहता है 5:40 बहुत प्रभावशाली अगर आप मुझसे पूछें तो मुझे मिल गया 5:42 छवि निर्माण की गति 5:44 अविश्वसनीय प्रगति और वह दोनों है 5:47 एक ही समय में अद्भुत और डरावना 5:50 इस प्रकार के बारे में आपकी राय जानना अच्छा लगता है 5:52 छवि निर्माण और छवि संपादन का 5:54 मॉडल क्या आपको लगता है कि वे एक अच्छे हैं या 5:57 बुरी बात आप किस प्रकार के परिणाम 5:59 ऐसे मॉडल बनने के बारे में सोच सकते हैं 6:02 आप अधिक से अधिक शक्तिशाली पा सकते हैं 6:04 विशिष्ट मापदंडों पर विवरण वे 6:06 इन परिणामों को प्राप्त करने के लिए उनका उपयोग करें 6:08 कागज जो मैं निश्चित रूप से आपको आमंत्रित करता हूं 6:10 पढ़ें मैं आपको अपनी छवि देखने के लिए भी आमंत्रित करता हूं 6:13 और वीडियो यदि आप अधिक जानकारी चाहते हैं 6:14 छवि निर्माण भाग के बारे में और 6:17 समझें कि यह कैसे काम करता है धन्यवाद 6:20 डेल्टा अकादमी में मेरे दोस्त काम करने के लिए 6:22 एआई सीखने को मजेदार बनाने पर मैं हूं 6:26 इसके बारे में भावुक कृपया इसे आज़माएं 6:28 और मुझे बताएं कि आप क्या सोचते हैं I 6:30 व्यक्तिगत रूप से शिक्षण के इस तरीके से प्यार है और 6:33 मुझे यकीन है कि आप भी इसके लिए आपको धन्यवाद देंगे 6:35 उनकी जाँच करके मेरे काम का समर्थन करना 6:37 वेबसाइट और पूरा वीडियो देखकर 6:39 और मुझे आशा है कि आपने इसका आनंद लिया मैं आपको देखूंगा 6:42 अगले हफ्ते एक और अद्भुत पेपर के साथ