इस सप्ताह का पेपर आज तक का आपका अगला पसंदीदा मॉडल हो सकता है।
अगर आपको लगता है कि डेल या स्टेबल डिफ्यूजन जैसे हालिया इमेज जेनरेशन मॉडल अच्छे हैं, तो आपको विश्वास नहीं होगा कि यह कितना अविश्वसनीय है।
"यह वाला" इमेजिक है।
इमेजिक एक ऐसा प्रसार-आधारित मॉडल लेता है जो पाठ लेने और उसमें से छवियां उत्पन्न करने में सक्षम होता है और छवियों को संपादित करने के लिए मॉडल को अनुकूलित करता है। बस इसे देखें... आप एक छवि बना सकते हैं और फिर मॉडल को अपनी इच्छानुसार इसे संपादित करना सिखा सकते हैं।
नीचे दिए गए वीडियो में और जानें...
पूरा लेख पढ़ें: https://www.louisbouchard.ai/imagic/
कावर, बी., ज़ादा, एस., लैंग, ओ., तोव, ओ., चांग, एच., डेकेल, टी., मोसेरी, आई. और ईरानी, एम., 2022. इमेजिक: टेक्स्ट-आधारित वास्तविक छवि प्रसार मॉडल के साथ संपादन। arXiv प्रीप्रिंट arXiv:2210.09276।
► इसे स्थिर प्रसार के साथ प्रयोग करें: https://github.com/justinpinkney/stable-diffusion/blob/main/notebooks/imgic.ipynb
►माई न्यूज़लेटर (आपके ईमेल पर साप्ताहिक रूप से समझाया गया एक नया AI एप्लिकेशन!): https://www.louisbouchard.ai/newsletter/
0:24
देखें कि आप एक छवि उत्पन्न कर सकते हैं
0:26
और फिर मॉडल को किसी भी तरह संपादित करना सिखाएं
0:29
जिस तरह से आप चाहते हैं यह एक बहुत बड़ा कदम है
0:31
अपना खुद का फोटोशॉप रखने की दिशा में
0:33
डिजाइनर मुफ्त में न केवल मॉडल
0:36
समझता है कि आप क्या दिखाना चाहते हैं लेकिन
0:38
यह यथार्थवादी भी रहने में सक्षम है
0:41
प्रारंभिक के गुणों को रखने के रूप में
0:43
छवियां बस देखती हैं कि कुत्ता कैसे रहता है
0:46
सभी छवियों में समान यहाँ यह कार्य है
0:49
टेक्स्ट कंडीशन्ड इमेज एडिटिंग कहा जाता है
0:51
इसका मतलब है कि केवल उपयोग करके छवियों को संपादित करना
0:54
पाठ और एक प्रारंभिक छवि जो थी
0:57
बहुत असंभव एक साल भी नहीं
0:59
पहले अब देखो यह क्या कर सकता है हाँ यह
1:03
सभी एक ही इनपुट छवि से किया जाता है
1:05
और एक छोटा वाक्य जहाँ आप देखते हैं क्या
1:07
आप चाहते हैं कि यह कितना अद्भुत है
1:09
केवल एक चीज और भी कूलर है कि यह कैसा है
1:12
काम करता है चलो इसमें गोता लगाएँ लेकिन पहले अगर
1:15
आप वर्तमान में AI सीख रहे हैं या करना चाहते हैं
1:17
इसे सीखना शुरू करें आपको यह पसंद आएगा
1:19
अवसर मुझे पता है कि यह कितना कठिन हो सकता है
1:22
एआई सीखते समय वास्तविक प्रगति करें
1:24
कभी-कभी अतिरिक्त संरचना और
1:26
जवाबदेही वह हो सकती है जो आपको प्रस्तावित करती है
1:29
अगला स्तर अगर वह आपके जैसा लगता है
1:31
इस वीडियो के प्रायोजक में शामिल हों डेल्टा
1:33
डेल्टा अकादमी में अकादमी जो आप सीखते हैं
1:36
खेल का निर्माण करके सुदृढीकरण सीखना
1:38
लाइव कोहोर्ट में AIS शून्य से तक जाता है
1:41
निर्यात के माध्यम से अल्फागो तैयार किया गया
1:43
इंटरैक्टिव ट्यूटोरियल लाइव चर्चा
1:46
इन विशेषज्ञों और साप्ताहिक AI . के साथ
1:48
प्रतियोगिताओं का निर्माण यह सिर्फ नहीं है
1:51
एक और कोर्स स्पैम वेबसाइट यह तीव्र है
1:53
हाथ पर और उच्च गुणवत्ता पर ध्यान केंद्रित
1:56
डीपमाइंड ऑक्सफ़ोर्ड के विशेषज्ञों द्वारा डिज़ाइन किया गया
1:58
और कैम्ब्रिज यह वह जगह है जहाँ कोडर जाते हैं
2:01
फ्यूचर प्रूफ उनके कैरियर से
2:03
एआई के अग्रिम और मज़े के साथ-साथ a
2:06
साथियों और विशेषज्ञों का लाइव समुदाय
2:08
आगे बढ़ाओ तुम आइकोनिक लिखोगे
2:10
dqn से लेकर पायथन में एल्गोरिदम
2:13
अल्फ़ागो अब तक के सबसे अच्छे कार्यक्रमों में से एक है
2:16
नीचे दिए गए मेरे लिंक के माध्यम से अब उनसे जुड़ें
2:18
और प्रोमो कोड का उपयोग करें जो एआई प्राप्त करने के लिए है
2:21
10% की छूट
2:23
तो iMagic कैसे काम करता है जैसा कि हमने कहा था
2:26
संपादित करने के लिए एक छवि और एक कैप्शन लेता है
2:29
छवि सेट करें और आप उत्पन्न भी कर सकते हैं
2:31
इसके कई रूपांतर इस मॉडल
2:33
कागजों के विशाल बहुमत की तरह
2:35
जो इन दिनों रिलीज हो रहे हैं, वह किस पर आधारित है?
2:38
प्रसार मॉडल अधिक विशेष रूप से यह
2:41
एक छवि जनरेटर मॉडल लेता है जो था
2:43
से चित्र बनाने के लिए पहले से ही प्रशिक्षित
2:45
पाठ और इसे छवि संपादन के लिए अनुकूलित करता है
2:48
उनके मामले में यह Imogen का उपयोग करता है जो I
2:51
पिछले वीडियो में कवर किया गया यह एक है
2:53
प्रसार आधारित जनरेटिव मॉडल सक्षम
2:55
के बाद उच्च परिभाषा चित्र बनाएं
2:57
के विशाल डेटा सेट पर प्रशिक्षित किया जा रहा है
3:00
के मामले में छवि कैप्शन जोड़े
3:02
iMagic वे बस इसे पूर्व-प्रशिक्षित लेते हैं
3:05
बेसलाइन के रूप में इमेजन मॉडल और मेक
3:08
संपादित करने के लिए इसमें संशोधन
3:10
छवि को ध्यान में रखते हुए इनपुट के रूप में भेजी गई छवियां
3:13
विशिष्ट उपस्थिति जैसे कि कुत्ते का
3:16
दौड़ और पहचान और इसे संपादित करना
3:18
हमारे पाठ के बाद शुरू करने के लिए हमारे पास है
3:21
पाठ और प्रारंभिक दोनों को एन्कोड करने के लिए
3:23
इमेज एज ताकि इसे समझा जा सके
3:25
हमारे इमेजिंग मॉडल द्वारा जब यह किया जाता है
3:28
हम अपने टेक्स्ट एन्कोडिंग को अनुकूलित करते हैं हमारे टेक्स्ट
3:31
हमारे प्रारंभिक को बेहतर ढंग से फिट करने के लिए एम्बेडिंग
3:33
छवि मूल रूप से हमारा पाठ ले रही है
3:35
प्रतिनिधित्व और इसे हमारे लिए अनुकूलित करें
3:38
प्रारंभिक छवि जिसे ई ऑप्टिमाइज़ कहा जाता है
3:41
यकीन है कि यह समझता है कि इस उदाहरण में
3:43
हम एक ही तरह का उत्पन्न करना चाहते हैं
3:45
एक समान दिखने वाले पक्षी के साथ छवि और
3:48
पृष्ठभूमि तो हम अपना पूर्व-प्रशिक्षित लेते हैं
3:51
छवि जनरेटर को ठीक करने के लिए इसका अर्थ है
3:53
कि हम छवि और मॉडल को फिर से प्रशिक्षित करेंगे
3:55
हम अनुकूलित पाठ एम्बेडिंग रखते हुए
3:58
बस एक ही उत्पादन किया तो ये दोनों
4:01
टेक्स्ट एम्बेडिंग प्राप्त करने के लिए चरणों का उपयोग किया जाता है
4:03
छवि एम्बेडिंग के करीब
4:06
दोनों में से एक को फ्रीज करना और प्राप्त करना
4:08
अन्य करीब जो यह सुनिश्चित करेगा कि हम
4:10
टेक्स्ट और इनिशियल दोनों के लिए ऑप्टिमाइज़ करें
4:12
छवि न केवल दो में से एक अब कि
4:15
हमारा मॉडल प्रारंभिक छवि को समझता है
4:17
हमारे पाठ में और समझते हैं कि वे
4:19
समान हैं हमें इसे सिखाने की आवश्यकता है
4:21
इसके लिए नई छवि विविधताएं उत्पन्न करें
4:24
पाठ यह चिंगारी सुपर सरल है हमारा पाठ
4:27
एम्बेडिंग और छवि अनुकूलित
4:29
एम्बेडिंग बहुत समान हैं लेकिन फिर भी
4:32
ठीक वही नहीं जो हम करते हैं
4:34
यहाँ है कि हम छवि एम्बेडिंग लेते हैं
4:36
हमारे एन्कोडेड स्थान में और इसे थोड़ा स्थानांतरित करें
4:39
इस समय एम्बेड किए गए पाठ की ओर
4:42
यदि आप iMagic मॉडल को जेनरेट करने के लिए कहते हैं
4:45
अनुकूलित पाठ का उपयोग कर एक छवि it
4:47
आपको वही छवि देनी चाहिए जो आपकी
4:49
इनपुट छवि इसलिए यदि आप एम्बेडिंग को स्थानांतरित करते हैं
4:52
आपके टेक्स्ट को एम्बेड करने की ओर थोड़ा सा
4:55
छवि को थोड़ा सा संपादित भी करेगा
4:58
आप क्या चाहते हैं जितना अधिक आप इसे अंदर ले जाते हैं
5:00
यह स्थान जितना बड़ा संपादन होगा
5:02
और जितनी दूर से तुम पाओगे
5:05
आपकी प्रारंभिक छवि तो केवल एक चीज आप
5:07
अब यह पता लगाने की जरूरत है कि का आकार क्या है
5:10
यह कदम आप अपनी ओर ले जाना चाहते हैं
5:12
पाठ और वॉइला जब आप अपना . पाते हैं
5:15
सही संतुलन आपके पास एक नया मॉडल है
5:17
के रूप में कई विविधताएं उत्पन्न करने में सक्षम
5:20
आप महत्वपूर्ण छवि को संरक्षित करना चाहते हैं
5:22
रास्ता संपादित करते समय विशेषता दृश्य
5:25
आप चाहते हैं कि निश्चित रूप से परिणाम नहीं हैं
5:27
बिल्कुल सही जैसा कि आप यहाँ देख सकते हैं जहाँ
5:30
मॉडल या तो ठीक से संपादित नहीं करता है
5:32
या यादृच्छिक छवि संशोधन करता है
5:35
प्रारंभिक छवि जैसे क्रॉप करना or
5:37
अनुपयुक्त रूप से ज़ूम करना अभी भी रहता है
5:40
बहुत प्रभावशाली अगर आप मुझसे पूछें तो मुझे मिल गया
5:42
छवि निर्माण की गति
5:44
अविश्वसनीय प्रगति और वह दोनों है
5:47
एक ही समय में अद्भुत और डरावना
5:50
इस प्रकार के बारे में आपकी राय जानना अच्छा लगता है
5:52
छवि निर्माण और छवि संपादन का
5:54
मॉडल क्या आपको लगता है कि वे एक अच्छे हैं या
5:57
बुरी बात आप किस प्रकार के परिणाम
5:59
ऐसे मॉडल बनने के बारे में सोच सकते हैं
6:02
आप अधिक से अधिक शक्तिशाली पा सकते हैं
6:04
विशिष्ट मापदंडों पर विवरण वे
6:06
इन परिणामों को प्राप्त करने के लिए उनका उपयोग करें
6:08
कागज जो मैं निश्चित रूप से आपको आमंत्रित करता हूं
6:10
पढ़ें मैं आपको अपनी छवि देखने के लिए भी आमंत्रित करता हूं
6:13
और वीडियो यदि आप अधिक जानकारी चाहते हैं
6:14
छवि निर्माण भाग के बारे में और
6:17
समझें कि यह कैसे काम करता है धन्यवाद
6:20
डेल्टा अकादमी में मेरे दोस्त काम करने के लिए
6:22
एआई सीखने को मजेदार बनाने पर मैं हूं
6:26
इसके बारे में भावुक कृपया इसे आज़माएं
6:28
और मुझे बताएं कि आप क्या सोचते हैं I
6:30
व्यक्तिगत रूप से शिक्षण के इस तरीके से प्यार है और
6:33
मुझे यकीन है कि आप भी इसके लिए आपको धन्यवाद देंगे
6:35
उनकी जाँच करके मेरे काम का समर्थन करना
6:37
वेबसाइट और पूरा वीडियो देखकर
6:39
और मुझे आशा है कि आपने इसका आनंद लिया मैं आपको देखूंगा
6:42
अगले हफ्ते एक और अद्भुत पेपर के साथ