इस सप्ताह का पेपर आज तक का आपका अगला पसंदीदा मॉडल हो सकता है।  अगर आपको लगता है कि   या   जैसे हालिया इमेज जेनरेशन मॉडल अच्छे हैं, तो आपको विश्वास नहीं होगा कि यह कितना अविश्वसनीय है। डेल स्टेबल डिफ्यूजन  "यह वाला" इमेजिक है।  इमेजिक एक ऐसा प्रसार-आधारित मॉडल लेता है जो पाठ लेने और उसमें से छवियां उत्पन्न करने में सक्षम होता है और छवियों को संपादित करने के लिए मॉडल को अनुकूलित करता है। बस इसे देखें... आप एक छवि बना सकते हैं और फिर मॉडल को अपनी इच्छानुसार इसे संपादित करना सिखा सकते हैं।  नीचे दिए गए वीडियो में और जानें...   सन्दर्भ:  पूरा लेख पढ़ें:   कावर, बी., ज़ादा, एस., लैंग, ओ., तोव, ओ., चांग, एच., डेकेल, टी., मोसेरी, आई. और ईरानी, एम., 2022. इमेजिक: टेक्स्ट-आधारित वास्तविक छवि प्रसार मॉडल के साथ संपादन। arXiv प्रीप्रिंट arXiv:2210.09276।  ► इसे स्थिर प्रसार के साथ प्रयोग करें:   ►माई न्यूज़लेटर (आपके ईमेल पर साप्ताहिक रूप से समझाया गया एक नया AI एप्लिकेशन!):  https://www.louisbouchard.ai/imagic/ https://github.com/justinpinkney/stable-diffusion/blob/main/notebooks/imgic.ipynb https://www.louisbouchard.ai/newsletter/  वीडियो प्रतिलेख  0:24  देखें कि आप एक छवि उत्पन्न कर सकते हैं  0:26  और फिर मॉडल को किसी भी तरह संपादित करना सिखाएं  0:29  जिस तरह से आप चाहते हैं यह एक बहुत बड़ा कदम है  0:31  अपना खुद का फोटोशॉप रखने की दिशा में  0:33  डिजाइनर मुफ्त में न केवल मॉडल  0:36  समझता है कि आप क्या दिखाना चाहते हैं लेकिन  0:38  यह यथार्थवादी भी रहने में सक्षम है  0:41  प्रारंभिक के गुणों को रखने के रूप में  0:43  छवियां बस देखती हैं कि कुत्ता कैसे रहता है  0:46  सभी छवियों में समान यहाँ यह कार्य है  0:49  टेक्स्ट कंडीशन्ड इमेज एडिटिंग कहा जाता है  0:51  इसका मतलब है कि केवल उपयोग करके छवियों को संपादित करना  0:54  पाठ और एक प्रारंभिक छवि जो थी  0:57  बहुत असंभव एक साल भी नहीं  0:59  पहले अब देखो यह क्या कर सकता है हाँ यह  1:03  सभी एक ही इनपुट छवि से किया जाता है  1:05  और एक छोटा वाक्य जहाँ आप देखते हैं क्या  1:07  आप चाहते हैं कि यह कितना अद्भुत है  1:09  केवल एक चीज और भी कूलर है कि यह कैसा है  1:12  काम करता है चलो इसमें गोता लगाएँ लेकिन पहले अगर  1:15  आप वर्तमान में AI सीख रहे हैं या करना चाहते हैं  1:17  इसे सीखना शुरू करें आपको यह पसंद आएगा  1:19  अवसर मुझे पता है कि यह कितना कठिन हो सकता है  1:22  एआई सीखते समय वास्तविक प्रगति करें  1:24  कभी-कभी अतिरिक्त संरचना और  1:26  जवाबदेही वह हो सकती है जो आपको प्रस्तावित करती है  1:29  अगला स्तर अगर वह आपके जैसा लगता है  1:31  इस वीडियो के प्रायोजक में शामिल हों डेल्टा  1:33  डेल्टा अकादमी में अकादमी जो आप सीखते हैं  1:36  खेल का निर्माण करके सुदृढीकरण सीखना  1:38  लाइव कोहोर्ट में AIS शून्य से तक जाता है  1:41  निर्यात के माध्यम से अल्फागो तैयार किया गया  1:43  इंटरैक्टिव ट्यूटोरियल लाइव चर्चा  1:46  इन विशेषज्ञों और साप्ताहिक AI . के साथ  1:48  प्रतियोगिताओं का निर्माण यह सिर्फ नहीं है  1:51  एक और कोर्स स्पैम वेबसाइट यह तीव्र है  1:53  हाथ पर और उच्च गुणवत्ता पर ध्यान केंद्रित  1:56  डीपमाइंड ऑक्सफ़ोर्ड के विशेषज्ञों द्वारा डिज़ाइन किया गया  1:58  और कैम्ब्रिज यह वह जगह है जहाँ कोडर जाते हैं  2:01  फ्यूचर प्रूफ उनके कैरियर से  2:03  एआई के अग्रिम और मज़े के साथ-साथ a  2:06  साथियों और विशेषज्ञों का लाइव समुदाय  2:08  आगे बढ़ाओ तुम आइकोनिक लिखोगे  2:10  dqn से लेकर पायथन में एल्गोरिदम  2:13  अल्फ़ागो अब तक के सबसे अच्छे कार्यक्रमों में से एक है  2:16  नीचे दिए गए मेरे लिंक के माध्यम से अब उनसे जुड़ें  2:18  और प्रोमो कोड का उपयोग करें जो एआई प्राप्त करने के लिए है  2:21  10% की छूट  2:23  तो iMagic कैसे काम करता है जैसा कि हमने कहा था  2:26  संपादित करने के लिए एक छवि और एक कैप्शन लेता है  2:29  छवि सेट करें और आप उत्पन्न भी कर सकते हैं  2:31  इसके कई रूपांतर इस मॉडल  2:33  कागजों के विशाल बहुमत की तरह  2:35  जो इन दिनों रिलीज हो रहे हैं, वह किस पर आधारित है?  2:38  प्रसार मॉडल अधिक विशेष रूप से यह  2:41  एक छवि जनरेटर मॉडल लेता है जो था  2:43  से चित्र बनाने के लिए पहले से ही प्रशिक्षित  2:45  पाठ और इसे छवि संपादन के लिए अनुकूलित करता है  2:48  उनके मामले में यह Imogen का उपयोग करता है जो I  2:51  पिछले वीडियो में कवर किया गया यह एक है  2:53  प्रसार आधारित जनरेटिव मॉडल सक्षम  2:55  के बाद उच्च परिभाषा चित्र बनाएं  2:57  के विशाल डेटा सेट पर प्रशिक्षित किया जा रहा है  3:00  के मामले में छवि कैप्शन जोड़े  3:02  iMagic वे बस इसे पूर्व-प्रशिक्षित लेते हैं  3:05  बेसलाइन के रूप में इमेजन मॉडल और मेक  3:08  संपादित करने के लिए इसमें संशोधन  3:10  छवि को ध्यान में रखते हुए इनपुट के रूप में भेजी गई छवियां  3:13  विशिष्ट उपस्थिति जैसे कि कुत्ते का  3:16  दौड़ और पहचान और इसे संपादित करना  3:18  हमारे पाठ के बाद शुरू करने के लिए हमारे पास है  3:21  पाठ और प्रारंभिक दोनों को एन्कोड करने के लिए  3:23  इमेज एज ताकि इसे समझा जा सके  3:25  हमारे इमेजिंग मॉडल द्वारा जब यह किया जाता है  3:28  हम अपने टेक्स्ट एन्कोडिंग को अनुकूलित करते हैं हमारे टेक्स्ट  3:31  हमारे प्रारंभिक को बेहतर ढंग से फिट करने के लिए एम्बेडिंग  3:33  छवि मूल रूप से हमारा पाठ ले रही है  3:35  प्रतिनिधित्व और इसे हमारे लिए अनुकूलित करें  3:38  प्रारंभिक छवि जिसे ई ऑप्टिमाइज़ कहा जाता है  3:41  यकीन है कि यह समझता है कि इस उदाहरण में  3:43  हम एक ही तरह का उत्पन्न करना चाहते हैं  3:45  एक समान दिखने वाले पक्षी के साथ छवि और  3:48  पृष्ठभूमि तो हम अपना पूर्व-प्रशिक्षित लेते हैं  3:51  छवि जनरेटर को ठीक करने के लिए इसका अर्थ है  3:53  कि हम छवि और मॉडल को फिर से प्रशिक्षित करेंगे  3:55  हम अनुकूलित पाठ एम्बेडिंग रखते हुए  3:58  बस एक ही उत्पादन किया तो ये दोनों  4:01  टेक्स्ट एम्बेडिंग प्राप्त करने के लिए चरणों का उपयोग किया जाता है  4:03  छवि एम्बेडिंग के करीब  4:06  दोनों में से एक को फ्रीज करना और प्राप्त करना  4:08  अन्य करीब जो यह सुनिश्चित करेगा कि हम  4:10  टेक्स्ट और इनिशियल दोनों के लिए ऑप्टिमाइज़ करें  4:12  छवि न केवल दो में से एक अब कि  4:15  हमारा मॉडल प्रारंभिक छवि को समझता है  4:17  हमारे पाठ में और समझते हैं कि वे  4:19  समान हैं हमें इसे सिखाने की आवश्यकता है  4:21  इसके लिए नई छवि विविधताएं उत्पन्न करें  4:24  पाठ यह चिंगारी सुपर सरल है हमारा पाठ  4:27  एम्बेडिंग और छवि अनुकूलित  4:29  एम्बेडिंग बहुत समान हैं लेकिन फिर भी  4:32  ठीक वही नहीं जो हम करते हैं  4:34  यहाँ है कि हम छवि एम्बेडिंग लेते हैं  4:36  हमारे एन्कोडेड स्थान में और इसे थोड़ा स्थानांतरित करें  4:39  इस समय एम्बेड किए गए पाठ की ओर  4:42  यदि आप iMagic मॉडल को जेनरेट करने के लिए कहते हैं  4:45  अनुकूलित पाठ का उपयोग कर एक छवि it  4:47  आपको वही छवि देनी चाहिए जो आपकी  4:49  इनपुट छवि इसलिए यदि आप एम्बेडिंग को स्थानांतरित करते हैं  4:52  आपके टेक्स्ट को एम्बेड करने की ओर थोड़ा सा  4:55  छवि को थोड़ा सा संपादित भी करेगा  4:58  आप क्या चाहते हैं जितना अधिक आप इसे अंदर ले जाते हैं  5:00  यह स्थान जितना बड़ा संपादन होगा  5:02  और जितनी दूर से तुम पाओगे  5:05  आपकी प्रारंभिक छवि तो केवल एक चीज आप  5:07  अब यह पता लगाने की जरूरत है कि का आकार क्या है  5:10  यह कदम आप अपनी ओर ले जाना चाहते हैं  5:12  पाठ और वॉइला जब आप अपना . पाते हैं  5:15  सही संतुलन आपके पास एक नया मॉडल है  5:17  के रूप में कई विविधताएं उत्पन्न करने में सक्षम  5:20  आप महत्वपूर्ण छवि को संरक्षित करना चाहते हैं  5:22  रास्ता संपादित करते समय विशेषता दृश्य  5:25  आप चाहते हैं कि निश्चित रूप से परिणाम नहीं हैं  5:27  बिल्कुल सही जैसा कि आप यहाँ देख सकते हैं जहाँ  5:30  मॉडल या तो ठीक से संपादित नहीं करता है  5:32  या यादृच्छिक छवि संशोधन करता है  5:35  प्रारंभिक छवि जैसे क्रॉप करना or  5:37  अनुपयुक्त रूप से ज़ूम करना अभी भी रहता है  5:40  बहुत प्रभावशाली अगर आप मुझसे पूछें तो मुझे मिल गया  5:42  छवि निर्माण की गति  5:44  अविश्वसनीय प्रगति और वह दोनों है  5:47  एक ही समय में अद्भुत और डरावना  5:50  इस प्रकार के बारे में आपकी राय जानना अच्छा लगता है  5:52  छवि निर्माण और छवि संपादन का  5:54  मॉडल क्या आपको लगता है कि वे एक अच्छे हैं या  5:57  बुरी बात आप किस प्रकार के परिणाम  5:59  ऐसे मॉडल बनने के बारे में सोच सकते हैं  6:02  आप अधिक से अधिक शक्तिशाली पा सकते हैं  6:04  विशिष्ट मापदंडों पर विवरण वे  6:06  इन परिणामों को प्राप्त करने के लिए उनका उपयोग करें  6:08  कागज जो मैं निश्चित रूप से आपको आमंत्रित करता हूं  6:10  पढ़ें मैं आपको अपनी छवि देखने के लिए भी आमंत्रित करता हूं  6:13  और वीडियो यदि आप अधिक जानकारी चाहते हैं  6:14  छवि निर्माण भाग के बारे में और  6:17  समझें कि यह कैसे काम करता है धन्यवाद  6:20  डेल्टा अकादमी में मेरे दोस्त काम करने के लिए  6:22  एआई सीखने को मजेदार बनाने पर मैं हूं  6:26  इसके बारे में भावुक कृपया इसे आज़माएं  6:28  और मुझे बताएं कि आप क्या सोचते हैं I  6:30  व्यक्तिगत रूप से शिक्षण के इस तरीके से प्यार है और  6:33  मुझे यकीन है कि आप भी इसके लिए आपको धन्यवाद देंगे  6:35  उनकी जाँच करके मेरे काम का समर्थन करना  6:37  वेबसाइट और पूरा वीडियो देखकर  6:39  और मुझे आशा है कि आपने इसका आनंद लिया मैं आपको देखूंगा  6:42  अगले हफ्ते एक और अद्भुत पेपर के साथ

YouTube

Watch more on YouTube: https://www.youtube.com/c/WhatsAI

I explain Artificial Intelligence terms and news to non-experts.

2021 - HackerNoon Contributor of the Year - FACEBOOK

2022 - Best Data Science Newsletter

2022 - HackerNoon Contributor of the Year - Artificial Intelligence

2022 - HackerNoon Contributor of the Year - Computer Vision

2022 - HackerNoon Contributor of the Year - Data Science

2022 - HackerNoon Contributor of the Year - Google

2022 - HackerNoon Contributor of the Year - Innovation

2022 - HackerNoon Contributor of the Year - Machine Learning

2022 - HackerNoon Contributor of the Year - Natural Language Processing

2022 - Top Tech Youtuber

2021 - HackerNoon Contributor of the Year - DEEP-LEARNING

Nominated for 2022 - Best Data Science Newsletter

Nominated for 2022 - HackerNoon Contributor of the Year - Artificial Intelligence

Nominated for 2022 - Top Tech Youtuber

Nominated for 2022 - HackerNoon Contributor of the Year - Innovation

Nominated for 2022 - HackerNoon Contributor of the Year - Data Science

Nominated for 2022 - HackerNoon Contributor of the Year - Natural Language Processing

Nominated for 2022 - HackerNoon Contributor of the Year - Computer Vision

Nominated for 2022 - HackerNoon Contributor of the Year - Google

Nominated for 2022 - HackerNoon Contributor of the Year - Machine Learning

यह ऑडियो कहानी की मूल भाषा में निर्मित है!

बहुत लंबा; पढ़ने के लिए

इमेजिक: टेक्स्ट कमांड से एआई इमेज एडिटिंग

इमेजिक: टेक्स्ट कमांड से एआई इमेज एडिटिंग

About Author

टिप्पणियाँ

लेबल

इस लेख में चित्रित किया गया था

Related Stories

State of the Noonion: A New Era For Brands and Writers

State of the Noonion: Green Clock Strikes Noon

HackerNoon एक बहुभाषी प्लेटफ़ॉर्म है: सभी शीर्ष कहानियाँ अब 13 भाषाओं में उपलब्ध हैं

फ़ोरम से फ़ीड तक: सोशल मीडिया एल्गोरिदम डिजिटल इंटरैक्शन को कैसे आकार देते हैं

State of the Noonion: A New Era For Brands and Writers

State of the Noonion: Green Clock Strikes Noon

HackerNoon एक बहुभाषी प्लेटफ़ॉर्म है: सभी शीर्ष कहानियाँ अब 13 भाषाओं में उपलब्ध हैं

फ़ोरम से फ़ीड तक: सोशल मीडिया एल्गोरिदम डिजिटल इंटरैक्शन को कैसे आकार देते हैं

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps