paint-brush
यहां तक कि डिज्नी एआई में निवेश कर रहा है: विजुअल इफेक्ट्स के लिए फेस री-एजिंग पर एक नजरद्वारा@whatsai
1,045 रीडिंग
1,045 रीडिंग

यहां तक कि डिज्नी एआई में निवेश कर रहा है: विजुअल इफेक्ट्स के लिए फेस री-एजिंग पर एक नजर

द्वारा Louis Bouchard7m2022/12/24
Read on Terminal Reader

बहुत लंबा; पढ़ने के लिए

यह आमतौर पर कुशल कलाकारों द्वारा फोटोशॉप या इसी तरह के टूल का उपयोग करके आपकी तस्वीरों को संपादित करने के लिए किया जाता है, सबसे खराब, एक वीडियो में, उन्हें हर फ्रेम के लिए इस तरह का मैन्युअल संपादन करना पड़ता है! जरा सोचिए कि इसके लिए कितने काम की जरूरत होगी। खैर, यहाँ इस स्थिति के लिए एक समाधान और एक नई समस्या दोनों हैं...
featured image - यहां तक कि डिज्नी एआई में निवेश कर रहा है: विजुअल इफेक्ट्स के लिए फेस री-एजिंग पर एक नजर
Louis Bouchard HackerNoon profile picture

चाहे वह स्नैपचैट फिल्टर में मस्ती के लिए हो, किसी फिल्म के लिए, या यहां तक कि कुछ पहेलियों को दूर करने के लिए, हम सभी के मन में एक तस्वीर में अपनी उम्र बदलने में सक्षम होने की उपयोगिता है।

यह आमतौर पर कुशल कलाकारों द्वारा आपके चित्रों को संपादित करने के लिए फोटोशॉप या इसी तरह के टूल का उपयोग करके किया जाता है। सबसे खराब, एक वीडियो में, उन्हें हर फ्रेम के लिए इस तरह का मैन्युअल संपादन करना पड़ता है! जरा सोचिए कि इसके लिए कितने काम की जरूरत होगी। खैर, यहाँ इस स्थिति के लिए एक समाधान और एक नई समस्या दोनों हैं...

संदर्भ

►पूरा लेख पढ़ें: https://www.louisbouchard.ai/disney-re-age/
►Loss et al., DisneyResearch, 2022: FRAN, https://studios.disneyresearch.com/2022/11/30/production-ready-face-re-aging-for-visual-effects/
►GANs ने समझाया:
►एसएएम: https://yuval-alaluf.github.io/SAM/
►कलह: https://www.louisbouchard.ai/learn-ai-together/
►ट्विटर: https://twitter.com/Whats_AI
►मेरा न्यूज़लेटर (एक नया एआई एप्लिकेशन आपके ईमेल पर साप्ताहिक रूप से समझाया गया है!): https://www.louisbouchard.ai/newsletter/

वीडियो ट्रांसक्रिप्ट

0:02

[संगीत]

0:06

चाहे वह मज़ेदार Snapchat फ़िल्टर के लिए हो

0:08

एक फिल्म के लिए या कुछ को हटाने के लिए भी

0:11

पहेलियाँ हम सभी के मन में एक उपयोगिता है

0:13

में हमारी उम्र बदलने में सक्षम होने के लिए

0:15

चित्र यह आमतौर पर कुशल द्वारा किया जाता है

0:18

फोटोशॉप या इसी तरह का उपयोग करने वाले कलाकार

0:20

आपकी तस्वीरों को सबसे खराब तरीके से संपादित करने का टूल

0:23

वीडियो उन्हें इस तरह का करना है

0:24

हर फ्रेम के लिए मैन्युअल संपादन

0:27

आवश्यक कार्य की मात्रा की कल्पना करें

0:29

यहाँ एक समाधान और एक दोनों है

0:32

इस स्थिति के लिए नई समस्या डिज्नी की

0:35

सबसे हालिया प्रकाशन फ्रान ऐसा कर सकता है

0:38

के लिए स्वत: ही यह एक बड़ी बात है

0:41

फिल्म उद्योग आपको तुरंत अनुमति देता है

0:43

पूरी फिल्म के लिए किसी को री-एज करें

0:46

बहुत कम कास्ट लेकिन यह एक समस्या है

0:48

कलाकारों के लिए यह एक साथ कट जाता है

0:51

कुछ नौकरी के अवसर और उन्हें काटने में मदद करें

0:53

ध्यान केंद्रित करने के लिए लंबे और थकाऊ काम के घंटे

0:56

प्रतिभा संबंधी कार्य यहाँ कुछ अच्छा है

0:58

यह है कि उन्होंने एक फ्रंट-आधारित टूल बनाया है

1:01

कलाकारों के लिए परिणामों का उपयोग और संपादन करने के लिए

1:03

द्वारा उनके कार्य को और अधिक कुशल बनाना

1:05

बल्कि विवरण में सुधार पर ध्यान केंद्रित कर रहा है

1:08

मोनोटोनिक कॉपी पेस्टिंग एडिट्स की तुलना में

1:10

एक फ्रेम से दूसरे फ्रेम में मुझे सुनना अच्छा लगेगा

1:13

टिप्पणियों में इसके बारे में आपके विचार

1:15

नीचे या हमारे डिस्कॉर्ड समुदाय पर चैट करें

1:17

एआई एक साथ सीखें लेकिन इस वीडियो के लिए

1:20

आइए एक बार और विशुद्ध रूप से ध्यान दें

1:22

इस काम के सकारात्मक पक्ष

1:24

में उन्होंने वैज्ञानिक प्रगति की

1:26

वीडियो में चेहरों की डिजिटल री-एजिंग

1:29

आप इसका परिणाम देख रहे हैं

1:31

नया फ्रान एल्गोरिदम और मुझे विश्वास है कि आप कर सकते हैं

1:33

पहले से ही सहमत हैं कि ये कितने अद्भुत हैं

1:35

परिणाम देखें कि कितना अधिक है

1:38

यथार्थवादी यह अन्य की तुलना में दिखता है

1:40

अत्याधुनिक रीजिंग उस तक पहुंचती है

1:42

कई कलाकृतियाँ हैं और रखने में विफल हैं

1:44

व्यक्ति की पहचान एक ही प्लस

1:47

मित्र दृष्टिकोण की आवश्यकता नहीं है

1:49

चेहरों को अन्य की तरह केन्द्रित करें

1:51

दृष्टिकोण करते हैं जो इसे और भी अधिक बनाता है

1:53

प्रभावशाली और भी अविश्वसनीय है

1:55

उनका दृष्टिकोण पहले कितना सरल है

1:58

फ्रैंक आश्चर्यजनक रूप से चेहरे के लिए खड़ा है

2:01

री-एजिंग नेटवर्क इसका मतलब है कि

2:04

मॉडल चेहरा लेने और बदलने में सक्षम है

2:06

व्यक्ति कितने साल का दिखता है

2:08

स्थिरता यथार्थवाद और उच्च संकल्प

2:11

परिवर्तनशील भावों के परिणाम

2:13

के लिए दृष्टिकोण और प्रकाश की स्थिति

2:16

फिल्मों में अभिनेता की उम्र दिखती है

2:19

आमतौर पर प्रोडक्शन टीम द्वारा बदल दिया जाता है

2:20

समर्पित वेशभूषा केशविन्यास आदि का उपयोग करना

2:23

लक्षित उम्र और केवल चित्रित करने के लिए

2:26

डिजिटल कलाकारों को संपादित करने के लिए चेहरे को छोड़ दिया गया है

2:29

फ्रेम दर फ्रेम यहीं पर फ्रान आता है

2:32

के त्वचा क्षेत्रों पर सख्ती से ध्यान केंद्रित करने में

2:35

चेहरा वे वयस्क उम्र पर भी ध्यान केंद्रित करते हैं

2:38

फिल्मों के रूप में पहले से ही कुशल और है

2:40

बहुत कम उम्र के लिए विभिन्न तकनीकें

2:42

उनके पूरे शरीर और चेहरे के रूप में फिर से उम्र बढ़ने

2:44

आकार भिन्न और छोटे होते हैं

2:47

वे मामले हैं लेकिन वे चेहरा कैसे ले सकते हैं

2:49

किसी भी स्थिति से और बस इसे बदल दें

2:52

उपस्थिति कुछ दर्जन जोड़ने या निकालने के लिए

2:54

साल मुख्य रूप से क्योंकि उनके पास कोई जमीन नहीं है

2:56

इस कार्य पर सच्चाई का अर्थ है कि वे

2:59

दोहराने के लिए एक एल्गोरिथ्म को प्रशिक्षित नहीं कर सकता

3:01

चित्रों के पहले और बाद में वे

3:03

उनके पास नहीं है बहुत कम उदाहरण मौजूद हैं

3:05

20 या उससे अधिक वर्षों वाले एक ही व्यक्ति की

3:08

इसके अलावा हर कोण में उन्हें एक होना चाहिए

3:10

अलग दृष्टिकोण और पारंपरिक

3:12

पर्यवेक्षित शिक्षण दृष्टिकोण जहाँ आप

3:14

अपने उदाहरणों को दोहराने का प्रयास करें

3:16

आपके डेटा के सेट में पहले से मौजूद है

3:18

आमतौर पर शोधकर्ता इससे निपटते हैं

3:20

प्रशिक्षित शक्तिशाली मॉडल का उपयोग करने में समस्या

3:22

हालांकि सभी उम्र के नकली चेहरे उत्पन्न किए

3:25

परिणाम बहुत प्रभावशाली हैं

3:27

मुख्य रूप से केंद्रित और ललाट पर काम करते हैं

3:29

नकली के प्रशिक्षण डेटा के कारण चेहरे

3:32

इसके लिए उत्पन्न चेहरे इस प्रकार परिणाम

3:35

वास्तविक दुनिया के लिए शायद ही सामान्य हैं

3:38

दृश्य क्योंकि वे वास्तव में नहीं रखते हैं

3:40

व्यक्ति की पहचान के रूप में यह नहीं था

3:42

पर एक ही व्यक्ति का उपयोग करके प्रशिक्षित किया गया

3:44

समय की अलग-अलग अवधि लेकिन सिर्फ एक

3:46

विभिन्न लोगों के विभिन्न प्रकार

3:48

उम्र और ऐसे स्थिर मॉडल शायद ही हो

3:52

यथार्थवादी चेहरे की हरकतें पैदा करें

3:54

स्थैतिक छवियों पर इसके प्रशिक्षण के लिए

3:57

वास्तविक विश्व यांत्रिकी नहीं जानता

3:58

प्रकाश परिवर्तन आदि

4:01

उनका पहला योगदान निपट रहा है

4:03

छवियों की संख्या में यह गैप

4:05

अलग-अलग उम्र में एक ही व्यक्ति उनके

4:08

यहाँ लक्ष्य वही काम करना है जो

4:10

पिछले दृष्टिकोण लेकिन एक छोटे से

4:12

ट्वीक वे अभी भी जेनरेट का उपयोग कर रहे होंगे

4:15

नकली चेहरे लेकिन डेटा सेट बनाएंगे

4:18

अलग-अलग चेहरों के साथ एक ही चेहरे से भरा हुआ

4:20

किनारों तो मूल रूप से एक ही व्यक्ति के साथ

4:23

वही पृष्ठभूमि और वही सब कुछ

4:25

एल्गोरिदम रखने की उम्र को छोड़कर

4:27

चेहरे पर सख्ती से ध्यान केंद्रित किया

4:29

अलग-अलग उम्र में उन्हें लगा कि भले ही

4:32

ये दृष्टिकोण वास्तव में नहीं हैं

4:33

उनकी वास्तविक दुनिया में अच्छी तरह से सामान्यीकरण और

4:36

वीडियो दृश्यों में वे अभी भी समझते हैं

4:38

उम्र बढ़ने की प्रक्रिया वास्तव में अच्छी तरह से तो वे

4:40

अधिक छवियां उत्पन्न करने के लिए उनका उपयोग कर सकते हैं

4:43

अलग-अलग उम्र में एक ही व्यक्ति के रूप में

4:45

बेहतर डेटा सेट बनाने के लिए पहला कदम

4:48

यह कदम एक मॉडल का उपयोग करके किया जाता है जिसे कहा जाता है

4:50

राशि जो किसी व्यक्ति का चेहरा ले सकती है

4:53

पूरी तरह से केंद्रित है और इसे अभिकर्मक करता है

4:56

केवल हमारे सेट के निर्माण के लिए उपयोग किया जाएगा

4:57

पहले और बाद में उपयोग की जाने वाली तस्वीरें

4:59

अपने प्रशंसक को यह एल्गोरिथम प्रशिक्षण देने के लिए

5:02

चरण हमारे एल्गोरिदम के बाद से आवश्यक है

5:04

कुछ से सामान्यीकरण करने के लिए बहुत मूर्ख हैं

5:07

उदाहरण के रूप में हम मनुष्य करते हैं और हम नहीं कर सकते

5:10

वास्तविक के लगभग उतने ही चित्र प्राप्त करें

5:12

समान रोशनी वाले चेहरे

5:15

पृष्ठभूमि और एक ही कपड़े पर

5:17

विभिन्न आयु यह कृत्रिम रूप से होना चाहिए

5:19

उत्पन्न उनका दूसरा योगदान है

5:22

वे छवियों के इस नए सेट का उपयोग कर रहे हैं

5:24

बनाया और प्रशिक्षण और एल्गोरिथ्म सक्षम

5:27

वास्तविक दुनिया पर इस प्रक्रिया को दोहराने के लिए

5:30

अच्छी निरंतरता के साथ दृश्य

5:32

पूरे वीडियो में वे एल्गोरिथम फ्रेम करते हैं

5:35

निर्मित वास्तव में काफी सरल है और

5:37

छवि के लिए अधिकांश छवि के समान

5:39

अनुवाद एल्गोरिदम आप पाएंगे

5:41

वे एक यूनेट आर्किटेक्चर का उपयोग करते हैं जो लेता है

5:44

एक इनपुट और आउटपुट आयु और एक छवि

5:48

इसे बदलने का सबसे अच्छा तरीका सीखें

5:50

इसे सबसे अधिक एन्कोड करके एक नई छवि

5:53

सार्थक स्थान संभव और डिकोडिंग

5:55

यह नई छवि में तो नेटवर्क

5:58

कोई भी छवि लेना और उसमें उतरना सीखता है

6:00

जिसे हम एक अव्यक्त स्थान कहते हैं जहाँ हम

6:03

इस अव्यक्त स्थान में हमारे एनकोडिंग हैं

6:06

मूल रूप से सभी आवश्यक शामिल हैं

6:08

नेटवर्क ने इसके लिए सीखी जानकारी

6:10

विशिष्ट कार्य तो मूल रूप से

6:12

इसके लिए चेहरे की अलग-अलग विशेषताएं

6:14

विशेष व्यक्ति लेकिन नहीं करता है

6:16

छवि के बारे में जानकारी शामिल करें

6:18

पृष्ठभूमि या अन्य सुविधाएँ जो नहीं हैं

6:20

रीजिंग के लिए जरूरी है तो यह लेता है

6:23

किसी प्रकार की भविष्यवाणी करने की जानकारी

6:25

री-एजिंग मास्क यह मास्क ही होगा

6:27

संपादित करने की आवश्यकता वाले भागों को शामिल करें

6:29

फिर से उम्र बढ़ने के प्रभाव के लिए चित्र में

6:31

कार्यों को और अधिक प्रबंधनीय बनाना

6:34

एक बार पूरी छवि की भविष्यवाणी करने से

6:36

फिर से और हम केवल इस भविष्यवाणी को मर्ज करते हैं

6:39

प्राप्त करने के लिए हमारी प्रारंभिक छवि के लिए मुखौटा

6:41

फिर से वृद्ध चेहरा यह मुखौटा मुख्य है

6:43

कारण है कि उनका दृष्टिकोण इतना अधिक क्यों है

6:45

व्यक्ति के संरक्षण में बेहतर

6:47

पहचान क्योंकि वे अपनी सीमा रखते हैं

6:49

रीजिंग के लिए नेटवर्क की कार्रवाई का क्षेत्र

6:51

केवल संशोधन और संपूर्ण नहीं

6:54

छवि या यहां तक कि पूरा चेहरा जब आप

6:56

इसे और अधिक बुद्धिमान नहीं बना सकते बस बनाओ

6:59

यह अधिक विशिष्ट है कि मोड गुड़िया है

7:01

एक बंदूक दृष्टिकोण के बाद प्रशिक्षित किया गया

7:03

मतलब जैसा कि हमने कई वीडियो में कवर किया है

7:05

दूसरे मॉडल का उपयोग करेंगे जो आप यहां देख रहे हैं

7:08

दाईं ओर एक विवेचक कहा जाता है

7:10

एक साथ प्रशिक्षित और करते थे

7:12

गणना करें कि उत्पन्न पुन: आयु छवि

7:15

हमारे में मौजूद लोगों के समान है

7:17

प्रशिक्षण डेटा सेट मूल रूप से इसकी रेटिंग करता है

7:20

प्रशिक्षण मार्गदर्शन के लिए परिणाम और

7:22

वोइला इस तरह फ्रैन आपको फिर से बूढ़ा होने में मदद करता है

7:25

आपका चेहरा कहीं भी 18 और 85 के बीच

7:28

साल पुराना बेशक यह सिर्फ एक था

7:30

इस नए डिज्नी का सरल अवलोकन

7:32

शोध प्रकाशन और मैं अनुशंसा करता हूं

7:34

अधिक के लिए उनका उत्कृष्ट पेपर पढ़ना

7:36

सूचना और परिणाम विश्लेषण यदि आप

7:39

मेरे द्वारा सुझाई गई बंदूकों से अपरिचित हैं

7:40

संक्षिप्त परिचय वीडियो देख रहा हूँ मैं

7:43

उनके बारे में बनाया देखने के लिए धन्यवाद

7:45

और मैं आपको अगली बार साथ देखूंगा

7:47

एक और अद्भुत पेपर

7:48

[संगीत]

7:59

शुक्रिया

[संगीत]