चाहे वह स्नैपचैट फिल्टर में मस्ती के लिए हो, किसी फिल्म के लिए, या यहां तक कि कुछ पहेलियों को दूर करने के लिए, हम सभी के मन में एक तस्वीर में अपनी उम्र बदलने में सक्षम होने की उपयोगिता है। यह आमतौर पर कुशल कलाकारों द्वारा आपके चित्रों को संपादित करने के लिए फोटोशॉप या इसी तरह के टूल का उपयोग करके किया जाता है। सबसे खराब, एक वीडियो में, उन्हें हर फ्रेम के लिए इस तरह का मैन्युअल संपादन करना पड़ता है! जरा सोचिए कि इसके लिए कितने काम की जरूरत होगी। खैर, यहाँ इस स्थिति के लिए एक समाधान और एक नई समस्या दोनों हैं... संदर्भ ►पूरा लेख पढ़ें: ►Loss et al., DisneyResearch, 2022: FRAN, ►GANs ने समझाया: ►एसएएम: ►कलह: ►ट्विटर: ►मेरा न्यूज़लेटर (एक नया एआई एप्लिकेशन आपके ईमेल पर साप्ताहिक रूप से समझाया गया है!): https://www.louisbouchard.ai/disney-re-age/ https://studios.disneyresearch.com/2022/11/30/production-ready-face-re-aging-for-visual-effects/ https://youtu.be/ZnpZsiy_p2M https://yuval-alaluf.github.io/SAM/ https://www.louisbouchard.ai/learn-ai-together/ https://twitter.com/Whats_AI https://www.louisbouchard.ai/newsletter/ वीडियो ट्रांसक्रिप्ट 0:02 [संगीत] 0:06 चाहे वह मज़ेदार Snapchat फ़िल्टर के लिए हो 0:08 एक फिल्म के लिए या कुछ को हटाने के लिए भी 0:11 पहेलियाँ हम सभी के मन में एक उपयोगिता है 0:13 में हमारी उम्र बदलने में सक्षम होने के लिए 0:15 चित्र यह आमतौर पर कुशल द्वारा किया जाता है 0:18 फोटोशॉप या इसी तरह का उपयोग करने वाले कलाकार 0:20 आपकी तस्वीरों को सबसे खराब तरीके से संपादित करने का टूल 0:23 वीडियो उन्हें इस तरह का करना है 0:24 हर फ्रेम के लिए मैन्युअल संपादन 0:27 आवश्यक कार्य की मात्रा की कल्पना करें 0:29 यहाँ एक समाधान और एक दोनों है 0:32 इस स्थिति के लिए नई समस्या डिज्नी की 0:35 सबसे हालिया प्रकाशन फ्रान ऐसा कर सकता है 0:38 के लिए स्वत: ही यह एक बड़ी बात है 0:41 फिल्म उद्योग आपको तुरंत अनुमति देता है 0:43 पूरी फिल्म के लिए किसी को री-एज करें 0:46 बहुत कम कास्ट लेकिन यह एक समस्या है 0:48 कलाकारों के लिए यह एक साथ कट जाता है 0:51 कुछ नौकरी के अवसर और उन्हें काटने में मदद करें 0:53 ध्यान केंद्रित करने के लिए लंबे और थकाऊ काम के घंटे 0:56 प्रतिभा संबंधी कार्य यहाँ कुछ अच्छा है 0:58 यह है कि उन्होंने एक फ्रंट-आधारित टूल बनाया है 1:01 कलाकारों के लिए परिणामों का उपयोग और संपादन करने के लिए 1:03 द्वारा उनके कार्य को और अधिक कुशल बनाना 1:05 बल्कि विवरण में सुधार पर ध्यान केंद्रित कर रहा है 1:08 मोनोटोनिक कॉपी पेस्टिंग एडिट्स की तुलना में 1:10 एक फ्रेम से दूसरे फ्रेम में मुझे सुनना अच्छा लगेगा 1:13 टिप्पणियों में इसके बारे में आपके विचार 1:15 नीचे या हमारे डिस्कॉर्ड समुदाय पर चैट करें 1:17 एआई एक साथ सीखें लेकिन इस वीडियो के लिए 1:20 आइए एक बार और विशुद्ध रूप से ध्यान दें 1:22 इस काम के सकारात्मक पक्ष 1:24 में उन्होंने वैज्ञानिक प्रगति की 1:26 वीडियो में चेहरों की डिजिटल री-एजिंग 1:29 आप इसका परिणाम देख रहे हैं 1:31 नया फ्रान एल्गोरिदम और मुझे विश्वास है कि आप कर सकते हैं 1:33 पहले से ही सहमत हैं कि ये कितने अद्भुत हैं 1:35 परिणाम देखें कि कितना अधिक है 1:38 यथार्थवादी यह अन्य की तुलना में दिखता है 1:40 अत्याधुनिक रीजिंग उस तक पहुंचती है 1:42 कई कलाकृतियाँ हैं और रखने में विफल हैं 1:44 व्यक्ति की पहचान एक ही प्लस 1:47 मित्र दृष्टिकोण की आवश्यकता नहीं है 1:49 चेहरों को अन्य की तरह केन्द्रित करें 1:51 दृष्टिकोण करते हैं जो इसे और भी अधिक बनाता है 1:53 प्रभावशाली और भी अविश्वसनीय है 1:55 उनका दृष्टिकोण पहले कितना सरल है 1:58 फ्रैंक आश्चर्यजनक रूप से चेहरे के लिए खड़ा है 2:01 री-एजिंग नेटवर्क इसका मतलब है कि 2:04 मॉडल चेहरा लेने और बदलने में सक्षम है 2:06 व्यक्ति कितने साल का दिखता है 2:08 स्थिरता यथार्थवाद और उच्च संकल्प 2:11 परिवर्तनशील भावों के परिणाम 2:13 के लिए दृष्टिकोण और प्रकाश की स्थिति 2:16 फिल्मों में अभिनेता की उम्र दिखती है 2:19 आमतौर पर प्रोडक्शन टीम द्वारा बदल दिया जाता है 2:20 समर्पित वेशभूषा केशविन्यास आदि का उपयोग करना 2:23 लक्षित उम्र और केवल चित्रित करने के लिए 2:26 डिजिटल कलाकारों को संपादित करने के लिए चेहरे को छोड़ दिया गया है 2:29 फ्रेम दर फ्रेम यहीं पर फ्रान आता है 2:32 के त्वचा क्षेत्रों पर सख्ती से ध्यान केंद्रित करने में 2:35 चेहरा वे वयस्क उम्र पर भी ध्यान केंद्रित करते हैं 2:38 फिल्मों के रूप में पहले से ही कुशल और है 2:40 बहुत कम उम्र के लिए विभिन्न तकनीकें 2:42 उनके पूरे शरीर और चेहरे के रूप में फिर से उम्र बढ़ने 2:44 आकार भिन्न और छोटे होते हैं 2:47 वे मामले हैं लेकिन वे चेहरा कैसे ले सकते हैं 2:49 किसी भी स्थिति से और बस इसे बदल दें 2:52 उपस्थिति कुछ दर्जन जोड़ने या निकालने के लिए 2:54 साल मुख्य रूप से क्योंकि उनके पास कोई जमीन नहीं है 2:56 इस कार्य पर सच्चाई का अर्थ है कि वे 2:59 दोहराने के लिए एक एल्गोरिथ्म को प्रशिक्षित नहीं कर सकता 3:01 चित्रों के पहले और बाद में वे 3:03 उनके पास नहीं है बहुत कम उदाहरण मौजूद हैं 3:05 20 या उससे अधिक वर्षों वाले एक ही व्यक्ति की 3:08 इसके अलावा हर कोण में उन्हें एक होना चाहिए 3:10 अलग दृष्टिकोण और पारंपरिक 3:12 पर्यवेक्षित शिक्षण दृष्टिकोण जहाँ आप 3:14 अपने उदाहरणों को दोहराने का प्रयास करें 3:16 आपके डेटा के सेट में पहले से मौजूद है 3:18 आमतौर पर शोधकर्ता इससे निपटते हैं 3:20 प्रशिक्षित शक्तिशाली मॉडल का उपयोग करने में समस्या 3:22 हालांकि सभी उम्र के नकली चेहरे उत्पन्न किए 3:25 परिणाम बहुत प्रभावशाली हैं 3:27 मुख्य रूप से केंद्रित और ललाट पर काम करते हैं 3:29 नकली के प्रशिक्षण डेटा के कारण चेहरे 3:32 इसके लिए उत्पन्न चेहरे इस प्रकार परिणाम 3:35 वास्तविक दुनिया के लिए शायद ही सामान्य हैं 3:38 दृश्य क्योंकि वे वास्तव में नहीं रखते हैं 3:40 व्यक्ति की पहचान के रूप में यह नहीं था 3:42 पर एक ही व्यक्ति का उपयोग करके प्रशिक्षित किया गया 3:44 समय की अलग-अलग अवधि लेकिन सिर्फ एक 3:46 विभिन्न लोगों के विभिन्न प्रकार 3:48 उम्र और ऐसे स्थिर मॉडल शायद ही हो 3:52 यथार्थवादी चेहरे की हरकतें पैदा करें 3:54 स्थैतिक छवियों पर इसके प्रशिक्षण के लिए 3:57 वास्तविक विश्व यांत्रिकी नहीं जानता 3:58 प्रकाश परिवर्तन आदि 4:01 उनका पहला योगदान निपट रहा है 4:03 छवियों की संख्या में यह गैप 4:05 अलग-अलग उम्र में एक ही व्यक्ति उनके 4:08 यहाँ लक्ष्य वही काम करना है जो 4:10 पिछले दृष्टिकोण लेकिन एक छोटे से 4:12 ट्वीक वे अभी भी जेनरेट का उपयोग कर रहे होंगे 4:15 नकली चेहरे लेकिन डेटा सेट बनाएंगे 4:18 अलग-अलग चेहरों के साथ एक ही चेहरे से भरा हुआ 4:20 किनारों तो मूल रूप से एक ही व्यक्ति के साथ 4:23 वही पृष्ठभूमि और वही सब कुछ 4:25 एल्गोरिदम रखने की उम्र को छोड़कर 4:27 चेहरे पर सख्ती से ध्यान केंद्रित किया 4:29 अलग-अलग उम्र में उन्हें लगा कि भले ही 4:32 ये दृष्टिकोण वास्तव में नहीं हैं 4:33 उनकी वास्तविक दुनिया में अच्छी तरह से सामान्यीकरण और 4:36 वीडियो दृश्यों में वे अभी भी समझते हैं 4:38 उम्र बढ़ने की प्रक्रिया वास्तव में अच्छी तरह से तो वे 4:40 अधिक छवियां उत्पन्न करने के लिए उनका उपयोग कर सकते हैं 4:43 अलग-अलग उम्र में एक ही व्यक्ति के रूप में 4:45 बेहतर डेटा सेट बनाने के लिए पहला कदम 4:48 यह कदम एक मॉडल का उपयोग करके किया जाता है जिसे कहा जाता है 4:50 राशि जो किसी व्यक्ति का चेहरा ले सकती है 4:53 पूरी तरह से केंद्रित है और इसे अभिकर्मक करता है 4:56 केवल हमारे सेट के निर्माण के लिए उपयोग किया जाएगा 4:57 पहले और बाद में उपयोग की जाने वाली तस्वीरें 4:59 अपने प्रशंसक को यह एल्गोरिथम प्रशिक्षण देने के लिए 5:02 चरण हमारे एल्गोरिदम के बाद से आवश्यक है 5:04 कुछ से सामान्यीकरण करने के लिए बहुत मूर्ख हैं 5:07 उदाहरण के रूप में हम मनुष्य करते हैं और हम नहीं कर सकते 5:10 वास्तविक के लगभग उतने ही चित्र प्राप्त करें 5:12 समान रोशनी वाले चेहरे 5:15 पृष्ठभूमि और एक ही कपड़े पर 5:17 विभिन्न आयु यह कृत्रिम रूप से होना चाहिए 5:19 उत्पन्न उनका दूसरा योगदान है 5:22 वे छवियों के इस नए सेट का उपयोग कर रहे हैं 5:24 बनाया और प्रशिक्षण और एल्गोरिथ्म सक्षम 5:27 वास्तविक दुनिया पर इस प्रक्रिया को दोहराने के लिए 5:30 अच्छी निरंतरता के साथ दृश्य 5:32 पूरे वीडियो में वे एल्गोरिथम फ्रेम करते हैं 5:35 निर्मित वास्तव में काफी सरल है और 5:37 छवि के लिए अधिकांश छवि के समान 5:39 अनुवाद एल्गोरिदम आप पाएंगे 5:41 वे एक यूनेट आर्किटेक्चर का उपयोग करते हैं जो लेता है 5:44 एक इनपुट और आउटपुट आयु और एक छवि 5:48 इसे बदलने का सबसे अच्छा तरीका सीखें 5:50 इसे सबसे अधिक एन्कोड करके एक नई छवि 5:53 सार्थक स्थान संभव और डिकोडिंग 5:55 यह नई छवि में तो नेटवर्क 5:58 कोई भी छवि लेना और उसमें उतरना सीखता है 6:00 जिसे हम एक अव्यक्त स्थान कहते हैं जहाँ हम 6:03 इस अव्यक्त स्थान में हमारे एनकोडिंग हैं 6:06 मूल रूप से सभी आवश्यक शामिल हैं 6:08 नेटवर्क ने इसके लिए सीखी जानकारी 6:10 विशिष्ट कार्य तो मूल रूप से 6:12 इसके लिए चेहरे की अलग-अलग विशेषताएं 6:14 विशेष व्यक्ति लेकिन नहीं करता है 6:16 छवि के बारे में जानकारी शामिल करें 6:18 पृष्ठभूमि या अन्य सुविधाएँ जो नहीं हैं 6:20 रीजिंग के लिए जरूरी है तो यह लेता है 6:23 किसी प्रकार की भविष्यवाणी करने की जानकारी 6:25 री-एजिंग मास्क यह मास्क ही होगा 6:27 संपादित करने की आवश्यकता वाले भागों को शामिल करें 6:29 फिर से उम्र बढ़ने के प्रभाव के लिए चित्र में 6:31 कार्यों को और अधिक प्रबंधनीय बनाना 6:34 एक बार पूरी छवि की भविष्यवाणी करने से 6:36 फिर से और हम केवल इस भविष्यवाणी को मर्ज करते हैं 6:39 प्राप्त करने के लिए हमारी प्रारंभिक छवि के लिए मुखौटा 6:41 फिर से वृद्ध चेहरा यह मुखौटा मुख्य है 6:43 कारण है कि उनका दृष्टिकोण इतना अधिक क्यों है 6:45 व्यक्ति के संरक्षण में बेहतर 6:47 पहचान क्योंकि वे अपनी सीमा रखते हैं 6:49 रीजिंग के लिए नेटवर्क की कार्रवाई का क्षेत्र 6:51 केवल संशोधन और संपूर्ण नहीं 6:54 छवि या यहां तक कि पूरा चेहरा जब आप 6:56 इसे और अधिक बुद्धिमान नहीं बना सकते बस बनाओ 6:59 यह अधिक विशिष्ट है कि मोड गुड़िया है 7:01 एक बंदूक दृष्टिकोण के बाद प्रशिक्षित किया गया 7:03 मतलब जैसा कि हमने कई वीडियो में कवर किया है 7:05 दूसरे मॉडल का उपयोग करेंगे जो आप यहां देख रहे हैं 7:08 दाईं ओर एक विवेचक कहा जाता है 7:10 एक साथ प्रशिक्षित और करते थे 7:12 गणना करें कि उत्पन्न पुन: आयु छवि 7:15 हमारे में मौजूद लोगों के समान है 7:17 प्रशिक्षण डेटा सेट मूल रूप से इसकी रेटिंग करता है 7:20 प्रशिक्षण मार्गदर्शन के लिए परिणाम और 7:22 वोइला इस तरह फ्रैन आपको फिर से बूढ़ा होने में मदद करता है 7:25 आपका चेहरा कहीं भी 18 और 85 के बीच 7:28 साल पुराना बेशक यह सिर्फ एक था 7:30 इस नए डिज्नी का सरल अवलोकन 7:32 शोध प्रकाशन और मैं अनुशंसा करता हूं 7:34 अधिक के लिए उनका उत्कृष्ट पेपर पढ़ना 7:36 सूचना और परिणाम विश्लेषण यदि आप 7:39 मेरे द्वारा सुझाई गई बंदूकों से अपरिचित हैं 7:40 संक्षिप्त परिचय वीडियो देख रहा हूँ मैं 7:43 उनके बारे में बनाया देखने के लिए धन्यवाद 7:45 और मैं आपको अगली बार साथ देखूंगा 7:47 एक और अद्भुत पेपर 7:48 [संगीत] 7:59 शुक्रिया [संगीत]