paint-brush
इमेजिक: टेक्स्ट कमांड से एआई इमेज एडिटिंगद्वारा@whatsai
30,897 रीडिंग
30,897 रीडिंग

इमेजिक: टेक्स्ट कमांड से एआई इमेज एडिटिंग

द्वारा Louis Bouchard6m2022/10/23
Read on Terminal Reader
Read this story w/o Javascript

बहुत लंबा; पढ़ने के लिए

इमेजिक एक ऐसा प्रसार-आधारित मॉडल लेता है जो टेक्स्ट लेने और उसमें से छवियां उत्पन्न करने में सक्षम होता है और छवियों को संपादित करने के लिए मॉडल को अनुकूलित करता है। आप एक छवि उत्पन्न कर सकते हैं और फिर मॉडल को अपनी इच्छानुसार इसे संपादित करना सिखा सकते हैं। इमेजिक: डिफ्यूजन मॉडल के साथ टेक्स्ट-बेस्ड रियल इमेज एडिटिंग। ArXiv प्रीप्रिंट arXiv: 2210.09276। इसे स्थिर प्रसार के साथ प्रयोग करें: https://://www.louisbouchard.ai/imgic/

Company Mentioned

Mention Thumbnail
featured image - इमेजिक: टेक्स्ट कमांड से एआई इमेज एडिटिंग
Louis Bouchard HackerNoon profile picture

इस सप्ताह का पेपर आज तक का आपका अगला पसंदीदा मॉडल हो सकता है।

अगर आपको लगता है कि डेल या स्टेबल डिफ्यूजन जैसे हालिया इमेज जेनरेशन मॉडल अच्छे हैं, तो आपको विश्वास नहीं होगा कि यह कितना अविश्वसनीय है।

"यह वाला" इमेजिक है।

इमेजिक एक ऐसा प्रसार-आधारित मॉडल लेता है जो पाठ लेने और उसमें से छवियां उत्पन्न करने में सक्षम होता है और छवियों को संपादित करने के लिए मॉडल को अनुकूलित करता है। बस इसे देखें... आप एक छवि बना सकते हैं और फिर मॉडल को अपनी इच्छानुसार इसे संपादित करना सिखा सकते हैं।

नीचे दिए गए वीडियो में और जानें...

सन्दर्भ:

पूरा लेख पढ़ें: https://www.louisbouchard.ai/imagic/
कावर, बी., ज़ादा, एस., लैंग, ओ., तोव, ओ., चांग, एच., डेकेल, टी., मोसेरी, आई. और ईरानी, एम., 2022. इमेजिक: टेक्स्ट-आधारित वास्तविक छवि प्रसार मॉडल के साथ संपादन। arXiv प्रीप्रिंट arXiv:2210.09276।
► इसे स्थिर प्रसार के साथ प्रयोग करें: https://github.com/justinpinkney/stable-diffusion/blob/main/notebooks/imgic.ipynb
►माई न्यूज़लेटर (आपके ईमेल पर साप्ताहिक रूप से समझाया गया एक नया AI एप्लिकेशन!): https://www.louisbouchard.ai/newsletter/

वीडियो प्रतिलेख

0:24

देखें कि आप एक छवि उत्पन्न कर सकते हैं

0:26

और फिर मॉडल को किसी भी तरह संपादित करना सिखाएं

0:29

जिस तरह से आप चाहते हैं यह एक बहुत बड़ा कदम है

0:31

अपना खुद का फोटोशॉप रखने की दिशा में

0:33

डिजाइनर मुफ्त में न केवल मॉडल

0:36

समझता है कि आप क्या दिखाना चाहते हैं लेकिन

0:38

यह यथार्थवादी भी रहने में सक्षम है

0:41

प्रारंभिक के गुणों को रखने के रूप में

0:43

छवियां बस देखती हैं कि कुत्ता कैसे रहता है

0:46

सभी छवियों में समान यहाँ यह कार्य है

0:49

टेक्स्ट कंडीशन्ड इमेज एडिटिंग कहा जाता है

0:51

इसका मतलब है कि केवल उपयोग करके छवियों को संपादित करना

0:54

पाठ और एक प्रारंभिक छवि जो थी

0:57

बहुत असंभव एक साल भी नहीं

0:59

पहले अब देखो यह क्या कर सकता है हाँ यह

1:03

सभी एक ही इनपुट छवि से किया जाता है

1:05

और एक छोटा वाक्य जहाँ आप देखते हैं क्या

1:07

आप चाहते हैं कि यह कितना अद्भुत है

1:09

केवल एक चीज और भी कूलर है कि यह कैसा है

1:12

काम करता है चलो इसमें गोता लगाएँ लेकिन पहले अगर

1:15

आप वर्तमान में AI सीख रहे हैं या करना चाहते हैं

1:17

इसे सीखना शुरू करें आपको यह पसंद आएगा

1:19

अवसर मुझे पता है कि यह कितना कठिन हो सकता है

1:22

एआई सीखते समय वास्तविक प्रगति करें

1:24

कभी-कभी अतिरिक्त संरचना और

1:26

जवाबदेही वह हो सकती है जो आपको प्रस्तावित करती है

1:29

अगला स्तर अगर वह आपके जैसा लगता है

1:31

इस वीडियो के प्रायोजक में शामिल हों डेल्टा

1:33

डेल्टा अकादमी में अकादमी जो आप सीखते हैं

1:36

खेल का निर्माण करके सुदृढीकरण सीखना

1:38

लाइव कोहोर्ट में AIS शून्य से तक जाता है

1:41

निर्यात के माध्यम से अल्फागो तैयार किया गया

1:43

इंटरैक्टिव ट्यूटोरियल लाइव चर्चा

1:46

इन विशेषज्ञों और साप्ताहिक AI . के साथ

1:48

प्रतियोगिताओं का निर्माण यह सिर्फ नहीं है

1:51

एक और कोर्स स्पैम वेबसाइट यह तीव्र है

1:53

हाथ पर और उच्च गुणवत्ता पर ध्यान केंद्रित

1:56

डीपमाइंड ऑक्सफ़ोर्ड के विशेषज्ञों द्वारा डिज़ाइन किया गया

1:58

और कैम्ब्रिज यह वह जगह है जहाँ कोडर जाते हैं

2:01

फ्यूचर प्रूफ उनके कैरियर से

2:03

एआई के अग्रिम और मज़े के साथ-साथ a

2:06

साथियों और विशेषज्ञों का लाइव समुदाय

2:08

आगे बढ़ाओ तुम आइकोनिक लिखोगे

2:10

dqn से लेकर पायथन में एल्गोरिदम

2:13

अल्फ़ागो अब तक के सबसे अच्छे कार्यक्रमों में से एक है

2:16

नीचे दिए गए मेरे लिंक के माध्यम से अब उनसे जुड़ें

2:18

और प्रोमो कोड का उपयोग करें जो एआई प्राप्त करने के लिए है

2:21

10% की छूट

2:23

तो iMagic कैसे काम करता है जैसा कि हमने कहा था

2:26

संपादित करने के लिए एक छवि और एक कैप्शन लेता है

2:29

छवि सेट करें और आप उत्पन्न भी कर सकते हैं

2:31

इसके कई रूपांतर इस मॉडल

2:33

कागजों के विशाल बहुमत की तरह

2:35

जो इन दिनों रिलीज हो रहे हैं, वह किस पर आधारित है?

2:38

प्रसार मॉडल अधिक विशेष रूप से यह

2:41

एक छवि जनरेटर मॉडल लेता है जो था

2:43

से चित्र बनाने के लिए पहले से ही प्रशिक्षित

2:45

पाठ और इसे छवि संपादन के लिए अनुकूलित करता है

2:48

उनके मामले में यह Imogen का उपयोग करता है जो I

2:51

पिछले वीडियो में कवर किया गया यह एक है

2:53

प्रसार आधारित जनरेटिव मॉडल सक्षम

2:55

के बाद उच्च परिभाषा चित्र बनाएं

2:57

के विशाल डेटा सेट पर प्रशिक्षित किया जा रहा है

3:00

के मामले में छवि कैप्शन जोड़े

3:02

iMagic वे बस इसे पूर्व-प्रशिक्षित लेते हैं

3:05

बेसलाइन के रूप में इमेजन मॉडल और मेक

3:08

संपादित करने के लिए इसमें संशोधन

3:10

छवि को ध्यान में रखते हुए इनपुट के रूप में भेजी गई छवियां

3:13

विशिष्ट उपस्थिति जैसे कि कुत्ते का

3:16

दौड़ और पहचान और इसे संपादित करना

3:18

हमारे पाठ के बाद शुरू करने के लिए हमारे पास है

3:21

पाठ और प्रारंभिक दोनों को एन्कोड करने के लिए

3:23

इमेज एज ताकि इसे समझा जा सके

3:25

हमारे इमेजिंग मॉडल द्वारा जब यह किया जाता है

3:28

हम अपने टेक्स्ट एन्कोडिंग को अनुकूलित करते हैं हमारे टेक्स्ट

3:31

हमारे प्रारंभिक को बेहतर ढंग से फिट करने के लिए एम्बेडिंग

3:33

छवि मूल रूप से हमारा पाठ ले रही है

3:35

प्रतिनिधित्व और इसे हमारे लिए अनुकूलित करें

3:38

प्रारंभिक छवि जिसे ई ऑप्टिमाइज़ कहा जाता है

3:41

यकीन है कि यह समझता है कि इस उदाहरण में

3:43

हम एक ही तरह का उत्पन्न करना चाहते हैं

3:45

एक समान दिखने वाले पक्षी के साथ छवि और

3:48

पृष्ठभूमि तो हम अपना पूर्व-प्रशिक्षित लेते हैं

3:51

छवि जनरेटर को ठीक करने के लिए इसका अर्थ है

3:53

कि हम छवि और मॉडल को फिर से प्रशिक्षित करेंगे

3:55

हम अनुकूलित पाठ एम्बेडिंग रखते हुए

3:58

बस एक ही उत्पादन किया तो ये दोनों

4:01

टेक्स्ट एम्बेडिंग प्राप्त करने के लिए चरणों का उपयोग किया जाता है

4:03

छवि एम्बेडिंग के करीब

4:06

दोनों में से एक को फ्रीज करना और प्राप्त करना

4:08

अन्य करीब जो यह सुनिश्चित करेगा कि हम

4:10

टेक्स्ट और इनिशियल दोनों के लिए ऑप्टिमाइज़ करें

4:12

छवि न केवल दो में से एक अब कि

4:15

हमारा मॉडल प्रारंभिक छवि को समझता है

4:17

हमारे पाठ में और समझते हैं कि वे

4:19

समान हैं हमें इसे सिखाने की आवश्यकता है

4:21

इसके लिए नई छवि विविधताएं उत्पन्न करें

4:24

पाठ यह चिंगारी सुपर सरल है हमारा पाठ

4:27

एम्बेडिंग और छवि अनुकूलित

4:29

एम्बेडिंग बहुत समान हैं लेकिन फिर भी

4:32

ठीक वही नहीं जो हम करते हैं

4:34

यहाँ है कि हम छवि एम्बेडिंग लेते हैं

4:36

हमारे एन्कोडेड स्थान में और इसे थोड़ा स्थानांतरित करें

4:39

इस समय एम्बेड किए गए पाठ की ओर

4:42

यदि आप iMagic मॉडल को जेनरेट करने के लिए कहते हैं

4:45

अनुकूलित पाठ का उपयोग कर एक छवि it

4:47

आपको वही छवि देनी चाहिए जो आपकी

4:49

इनपुट छवि इसलिए यदि आप एम्बेडिंग को स्थानांतरित करते हैं

4:52

आपके टेक्स्ट को एम्बेड करने की ओर थोड़ा सा

4:55

छवि को थोड़ा सा संपादित भी करेगा

4:58

आप क्या चाहते हैं जितना अधिक आप इसे अंदर ले जाते हैं

5:00

यह स्थान जितना बड़ा संपादन होगा

5:02

और जितनी दूर से तुम पाओगे

5:05

आपकी प्रारंभिक छवि तो केवल एक चीज आप

5:07

अब यह पता लगाने की जरूरत है कि का आकार क्या है

5:10

यह कदम आप अपनी ओर ले जाना चाहते हैं

5:12

पाठ और वॉइला जब आप अपना . पाते हैं

5:15

सही संतुलन आपके पास एक नया मॉडल है

5:17

के रूप में कई विविधताएं उत्पन्न करने में सक्षम

5:20

आप महत्वपूर्ण छवि को संरक्षित करना चाहते हैं

5:22

रास्ता संपादित करते समय विशेषता दृश्य

5:25

आप चाहते हैं कि निश्चित रूप से परिणाम नहीं हैं

5:27

बिल्कुल सही जैसा कि आप यहाँ देख सकते हैं जहाँ

5:30

मॉडल या तो ठीक से संपादित नहीं करता है

5:32

या यादृच्छिक छवि संशोधन करता है

5:35

प्रारंभिक छवि जैसे क्रॉप करना or

5:37

अनुपयुक्त रूप से ज़ूम करना अभी भी रहता है

5:40

बहुत प्रभावशाली अगर आप मुझसे पूछें तो मुझे मिल गया

5:42

छवि निर्माण की गति

5:44

अविश्वसनीय प्रगति और वह दोनों है

5:47

एक ही समय में अद्भुत और डरावना

5:50

इस प्रकार के बारे में आपकी राय जानना अच्छा लगता है

5:52

छवि निर्माण और छवि संपादन का

5:54

मॉडल क्या आपको लगता है कि वे एक अच्छे हैं या

5:57

बुरी बात आप किस प्रकार के परिणाम

5:59

ऐसे मॉडल बनने के बारे में सोच सकते हैं

6:02

आप अधिक से अधिक शक्तिशाली पा सकते हैं

6:04

विशिष्ट मापदंडों पर विवरण वे

6:06

इन परिणामों को प्राप्त करने के लिए उनका उपयोग करें

6:08

कागज जो मैं निश्चित रूप से आपको आमंत्रित करता हूं

6:10

पढ़ें मैं आपको अपनी छवि देखने के लिए भी आमंत्रित करता हूं

6:13

और वीडियो यदि आप अधिक जानकारी चाहते हैं

6:14

छवि निर्माण भाग के बारे में और

6:17

समझें कि यह कैसे काम करता है धन्यवाद

6:20

डेल्टा अकादमी में मेरे दोस्त काम करने के लिए

6:22

एआई सीखने को मजेदार बनाने पर मैं हूं

6:26

इसके बारे में भावुक कृपया इसे आज़माएं

6:28

और मुझे बताएं कि आप क्या सोचते हैं I

6:30

व्यक्तिगत रूप से शिक्षण के इस तरीके से प्यार है और

6:33

मुझे यकीन है कि आप भी इसके लिए आपको धन्यवाद देंगे

6:35

उनकी जाँच करके मेरे काम का समर्थन करना

6:37

वेबसाइट और पूरा वीडियो देखकर

6:39

और मुझे आशा है कि आपने इसका आनंद लिया मैं आपको देखूंगा

6:42

अगले हफ्ते एक और अद्भुत पेपर के साथ