paint-brush
जंगल में एआई-जनरेटेड चेहरे खोजना: परिणाम द्वारा@botbeat
144 रीडिंग

जंगल में एआई-जनरेटेड चेहरे खोजना: परिणाम

द्वारा BotBeat.Tech: Trusted Generative AI Research Firm
BotBeat.Tech: Trusted Generative AI Research Firm HackerNoon profile picture

BotBeat.Tech: Trusted Generative AI Research Firm

@botbeat

"BotBeat is an AI Research Goldmine" - said real person...

7 मिनट read2024/06/12
Read on Terminal Reader
Read this story in a terminal
Print this story

बहुत लंबा; पढ़ने के लिए

AI ऑनलाइन घोटालों के लिए यथार्थवादी नकली चेहरे बना सकता है। यह कार्य छवियों में AI-जनित चेहरों का पता लगाने की विधि प्रस्तावित करता है।
featured image - जंगल में एआई-जनरेटेड चेहरे खोजना: परिणाम
BotBeat.Tech: Trusted Generative AI Research Firm HackerNoon profile picture
BotBeat.Tech: Trusted Generative AI Research Firm

BotBeat.Tech: Trusted Generative AI Research Firm

@botbeat

"BotBeat is an AI Research Goldmine" - said real person talking to a bot on Twitter/X/Gronk/WhateverWeAreCallingIt

0-item

STORY’S CREDIBILITY

Academic Research Paper

Academic Research Paper

Part of HackerNoon's growing list of open-source research papers, promoting free access to academic material.

लेखक:

(1) गोंजालो जे. अनियानो पोर्सिल, लिंक्डइन;

(2) जैक गिन्डी, लिंक्डइन;

(3) शिवांश मुंद्रा, लिंक्डइन;

(4) जेम्स आर. वर्बस, लिंक्डइन;

(5) हनी फ़रीद, लिंक्डइन और यूनिवर्सिटी ऑफ़ कैलिफ़ोर्निया, बर्कले।

लिंक की तालिका

4. परिणाम

हमारा आधारभूत प्रशिक्षण और मूल्यांकन प्रदर्शन तालिका 2 में दिखाया गया है। मूल्यांकन इस आधार पर विभाजित किया गया है कि मूल्यांकन छवियों में चेहरा है या नहीं (प्रशिक्षण छवियों में केवल चेहरे थे) और क्या छवियों को प्रशिक्षण में उपयोग किए गए समान (इंजन में) या अलग (इंजन से बाहर) संश्लेषण इंजनों के साथ उत्पन्न किया गया था (अनुभाग 2.6 देखें)। प्रशिक्षण और मूल्यांकन के लिए सच्ची सकारात्मक दर[8] (TPR) की सीधी तुलना प्रदान करने के लिए, हम अंतिम वर्गीकरण सीमा को 0.5% की झूठी सकारात्मक दर[9] (FPR) प्राप्त करने के लिए समायोजित करते हैं।


0.5% की निश्चित FPR के साथ, AI द्वारा उत्पन्न चेहरे 98% की दर से प्रशिक्षण और मूल्यांकन में सही ढंग से वर्गीकृत किए जाते हैं। प्रशिक्षण के लिए उपयोग किए जाने वाले विभिन्न संश्लेषण इंजनों (स्टाइलगैन 1,2,3, स्टेबल डिफ्यूजन 1,2, और DALL-E 2) में, TPR स्टेबल डिफ्यूजन 1 के लिए 93.3% के निम्न से लेकर स्टाइलगैन 2 के लिए 99.5% के उच्च स्तर तक, और स्टाइलगैन1 के लिए 98.9%, स्टाइलगैन3 के लिए 99.9%, स्टेबल डिफ्यूजन 2 के लिए 94.9% और DALL-E 2 के लिए 99.2% तक कुछ हद तक भिन्न था।


संश्लेषण इंजन द्वारा उत्पन्न चेहरों के लिए जिनका उपयोग नहीं किया जाता



चित्र 3. एआई द्वारा निर्मित चेहरे (0.5% की निश्चित एफपीआर के साथ) को सही ढंग से वर्गीकृत करने के लिए सच्ची सकारात्मक दर (टीपीआर) निम्नलिखित के आधार पर: (ए) रिज़ॉल्यूशन, जहां मॉडल को 512 × 512 छवियों पर प्रशिक्षित किया जाता है और विभिन्न रिज़ॉल्यूशन (ठोस नीला) के विरुद्ध मूल्यांकन किया जाता है और एकल रिज़ॉल्यूशन एन × एन (धराशायी लाल) पर प्रशिक्षित और मूल्यांकन किया जाता है; और (बी) जेपीईजी गुणवत्ता, जहां मॉडल को असम्पीडित छवियों और जेपीईजी संपीड़ित छवियों की एक श्रृंखला पर प्रशिक्षित किया जाता है और 20 (न्यूनतम) से 100 (उच्चतम) के बीच जेपीईजी गुणवत्ता पर मूल्यांकन किया जाता है।

चित्र 3. एआई द्वारा निर्मित चेहरे (0.5% की निश्चित एफपीआर के साथ) को सही ढंग से वर्गीकृत करने के लिए सच्ची सकारात्मक दर (टीपीआर) निम्नलिखित के आधार पर: (ए) रिज़ॉल्यूशन, जहां मॉडल को 512 × 512 छवियों पर प्रशिक्षित किया जाता है और विभिन्न रिज़ॉल्यूशन (ठोस नीला) के विरुद्ध मूल्यांकन किया जाता है और एकल रिज़ॉल्यूशन एन × एन (धराशायी लाल) पर प्रशिक्षित और मूल्यांकन किया जाता है; और (बी) जेपीईजी गुणवत्ता, जहां मॉडल को असम्पीडित छवियों और जेपीईजी संपीड़ित छवियों की एक श्रृंखला पर प्रशिक्षित किया जाता है और 20 (न्यूनतम) से 100 (उच्चतम) के बीच जेपीईजी गुणवत्ता पर मूल्यांकन किया जाता है।



प्रशिक्षण (इंजन से बाहर), उसी FPR पर TPR 84.5% तक गिर जाता है, जो डोमेन से बाहर सामान्यीकरण को अच्छा लेकिन पूर्ण नहीं दिखाता है। प्रशिक्षण में उपयोग नहीं किए गए विभिन्न संश्लेषण इंजनों में, TPR में व्यापक रूप से भिन्नता थी, जिसमें मिडजर्नी के लिए 19.4% से लेकर EG3D के लिए 99.5% और जेनरेटेड.फोटो के लिए 95.4% का न्यूनतम था। हमारा क्लासिफायर कुछ मामलों में अच्छी तरह से सामान्यीकरण करता है, और अन्य में विफल रहता है। हालाँकि, इस सीमा को प्रारंभिक प्रशिक्षण में इन आउट-ऑफ-इंजन छवियों को शामिल करके कम किया जा सकता है।


एक विशेष रूप से चौंकाने वाले परिणाम में, गैर-चेहरे - प्रशिक्षण में उपयोग किए जाने वाले समान संश्लेषण इंजनों द्वारा उत्पन्न - सभी गलत तरीके से वर्गीकृत किए गए हैं। यह सबसे अधिक संभावना है क्योंकि हमारी कुछ वास्तविक छवियों में गैर-चेहरे होते हैं (अनुभाग 2.1 देखें) जबकि सभी AI-जनरेटेड छवियों में चेहरे होते हैं। चूँकि हम केवल खाता बनाने के लिए उपयोग किए जाने वाले नकली चेहरों का पता लगाने में रुचि रखते हैं, इसलिए हम इसे एक बड़ी सीमा के रूप में नहीं देखते हैं। यह परिणाम यह भी बताता है कि हमारे क्लासिफायर ने AI-जनरेटेड चेहरे की एक विशिष्ट संपत्ति पर ध्यान दिया है, न कि अंतर्निहित संश्लेषण से कुछ निम्न-स्तरीय आर्टिफैक्ट (जैसे, एक शोर फिंगरप्रिंट [8])। अनुभाग 4.1 में, हम इस परिकल्पना का समर्थन करने के लिए अतिरिक्त सबूत प्रदान करते हैं।


उपरोक्त बेसलाइन परिणाम 512x512 पिक्सल के रिज़ॉल्यूशन पर छवियों के प्रशिक्षण और मूल्यांकन पर आधारित हैं। चित्र 3(ए) (ठोस नीला) में दिखाया गया TPR है जब प्रशिक्षण छवियों को कम रिज़ॉल्यूशन (256, 128, 64, और 32) पर स्केल किया जाता है और फिर वर्गीकरण के लिए 512 तक स्केल किया जाता है। 0.5% के समान FPR के साथ, AI द्वारा उत्पन्न चेहरे को वर्गीकृत करने के लिए TPR 98.0% की बेसलाइन से काफी तेज़ी से गिरता है।


हालाँकि, जब मॉडल को N × N (N = 32, 64, 128, या 256) के रिज़ॉल्यूशन पर छवियों पर प्रशिक्षित किया जाता है और फिर प्रशिक्षण में देखे गए समान TPR के विरुद्ध मूल्यांकन किया जाता है, तो वास्तविक सकारात्मक दर में काफी सुधार होता है, चित्र 3(a) (धराशायी लाल)। पहले की तरह, झूठी सकारात्मक दर 0.5% पर तय की गई है। यहाँ हम देखते हैं कि 128 × 128 के रिज़ॉल्यूशन पर TPR अपेक्षाकृत उच्च (91.9%) रहता है और केवल 32×32 (44.1%) के सबसे कम रिज़ॉल्यूशन पर ही कम होता है। अपेक्षाकृत कम रिज़ॉल्यूशन पर भी AI-जनरेटेड चेहरों का पता लगाने की क्षमता बताती है कि हमारा मॉडल किसी ऐसे निम्न-स्तरीय आर्टिफैक्ट पर नहीं टिका है जो डाउन-सैंपलिंग के इस स्तर पर टिक नहीं पाएगा।


चित्र 3(बी) में क्लासिफायर का टीपीआर दिखाया गया है, जिसे अलग-अलग गुणवत्ता की असम्पीडित PNG और JPEG छवियों पर प्रशिक्षित किया गया है, जिसका मूल्यांकन JPEG गुणवत्ता की एक श्रेणी (100 की उच्चतम गुणवत्ता से लेकर 20 की निम्नतम गुणवत्ता तक) में छवियों के विरुद्ध किया गया है। यहाँ हम देखते हैं कि AI द्वारा उत्पन्न चेहरे (FPR 0.5% है) की पहचान करने के लिए TPR धीरे-धीरे कम हो जाती है, जिसकी गुणवत्ता 80 पर 94.3% की TPR और 60 की गुणवत्ता पर 88.0% की TPR है। फिर से, JPEG संपीड़न कलाकृतियों की उपस्थिति में AI द्वारा उत्पन्न चेहरों का पता लगाने की क्षमता बताती है कि हमारा मॉडल निम्न-स्तरीय कलाकृति पर नहीं टिका है।

4.1. व्याख्यात्मकता

जैसा कि अनुभाग 4 में दिखाया गया है, हमारा क्लासिफायर विभिन्न संश्लेषण इंजनों की एक श्रृंखला से उत्पन्न एआई चेहरों को अलग करने में अत्यधिक सक्षम है। हालाँकि, यह क्लासिफायर केवल चेहरों तक ही सीमित है, तालिका 2। यानी, जब प्रशिक्षण में उपयोग किए जाने वाले समान संश्लेषण इंजनों से गैर-चेहरे की छवियाँ प्रस्तुत की जाती हैं, तो क्लासिफायर उन्हें एआई-जनरेटेड के रूप में वर्गीकृत करने में पूरी तरह विफल हो जाता है।


हम मानते हैं कि हमारे क्लासिफायर ने एक सिमेंटिक-लेवल आर्टिफैक्ट सीखा होगा। यह दावा आंशिक रूप से इस तथ्य से समर्थित है कि हमारा क्लासिफायर 128x128 पिक्सल जैसे कम रिज़ॉल्यूशन पर भी अत्यधिक सटीक रहता है, चित्र 3(ए), और काफी आक्रामक जेपीईजी संपीड़न के सामने भी यथोचित रूप से सटीक रहता है, चित्र 3(बी)। यहाँ हम इस दावे का समर्थन करने के लिए और सबूत देते हैं कि हमने एक संरचनात्मक- या सिमेंटिक-लेवल आर्टिफैक्ट सीखा है।


यह अच्छी तरह से स्थापित है कि जबकि मानव दृश्य प्रणाली में सामान्य-उद्देश्य वाली वस्तु पहचान वस्तु अभिविन्यास, मुद्रा और परिप्रेक्ष्य विरूपण के लिए अत्यधिक मजबूत है, चेहरा पहचान और प्रसंस्करण एक साधारण उलटा होने के लिए भी कम मजबूत है [27]। इस प्रभाव को क्लासिक मार्गरेट थैचर भ्रम [31] में शानदार ढंग से चित्रित किया गया है। चित्र 4 की शीर्ष पंक्ति में चेहरे नीचे की पंक्ति में उन लोगों के उल्टे संस्करण हैं। दाईं ओर के संस्करण में, आँखें और मुंह चेहरे के सापेक्ष उल्टे हैं। यह विचित्र विशेषता कॉकटेल सीधे चेहरे में स्पष्ट है लेकिन उल्टे चेहरे में नहीं।


हमें आश्चर्य हुआ कि क्या हमारा वर्गीकरणकर्ता वर्गीकरण करने में संघर्ष करेगा



चित्र 4. मार्गरेट थैचर भ्रम [31]: ऊपर की पंक्ति में चेहरे नीचे की पंक्ति के चेहरों के उल्टे संस्करण हैं। जब चेहरा सीधा होता है तो नीचे दाईं ओर आंख और मुंह का उलटा होना स्पष्ट होता है, लेकिन जब यह उल्टा होता है तो नहीं। (क्रेडिट: रॉब बोगार्ट्स/एनेफो https://commons.wikimedia.org/w/index.php? curid=79649613))

चित्र 4. मार्गरेट थैचर भ्रम [31]: ऊपर की पंक्ति में चेहरे नीचे की पंक्ति के चेहरों के उल्टे संस्करण हैं। जब चेहरा सीधा होता है तो नीचे दाईं ओर आंख और मुंह का उलटा होना स्पष्ट होता है, लेकिन जब यह उल्टा होता है तो नहीं। (क्रेडिट: रॉब बोगार्ट्स/एनेफो https://commons.wikimedia.org/w/index.php? curid=79649613))



ऊर्ध्वाधर रूप से उल्टे चेहरे। उन्हीं 10,000 सत्यापन छवियों (धारा 2.6) को उलट दिया गया और पुनः वर्गीकृत किया गया। 0.5% के समान निश्चित FPR के साथ, TPR 98.0% से 20 प्रतिशत अंक गिरकर 77.7% हो गया।


तुलना करके, सत्यापन छवियों को केवल ऊर्ध्वाधर अक्ष (यानी, बाएं-दाएं फ्लिप) के बारे में फ़्लिप करने से समान 0.5% FPR के साथ 98.0% के TPR में कोई बदलाव नहीं होता है। परिणामों की यह जोड़ी, रिज़ॉल्यूशन और संपीड़न गुणवत्ता की मजबूती के साथ मिलकर यह सुझाव देती है कि हमारा मॉडल किसी निम्न-स्तरीय आर्टिफ़ैक्ट पर नहीं टिका है, और इसके बजाय एक संरचनात्मक या अर्थपूर्ण गुण की खोज कर सकता है जो AI-जनरेटेड चेहरों को वास्तविक चेहरों से अलग करता है।


हम एकीकृत ग्रेडिएंट की विधि [28] का उपयोग करके अपने क्लासिफायर की प्रकृति का और पता लगाते हैं। यह विधि एक गहरे नेटवर्क द्वारा की गई भविष्यवाणियों को उसके इनपुट फीचर्स के लिए जिम्मेदार ठहराती है। क्योंकि इस विधि को प्रशिक्षित मॉडल में किसी भी बदलाव के बिना लागू किया जा सकता है, यह हमें मॉडल के निर्णय के संबंध में प्रत्येक इनपुट छवि पिक्सेल की प्रासंगिकता की गणना करने की अनुमति देता है।


चित्र 5(a) में 100 स्टाइलगैन 2 छवियों पर औसत किए गए सामान्यीकृत ([0, 1] की सीमा में) एकीकृत ग्रेडिएंट का अहस्ताक्षरित परिमाण दिखाया गया है (क्योंकि स्टाइलगैन द्वारा उत्पन्न सभी चेहरे संरेखित हैं, औसत ग्रेडिएंट सभी छवियों में चेहरे की विशेषताओं के अनुरूप है)। चित्र 5(b)-(e) में DALL-2, मिडजर्नी, स्टेबल डिफ्यूजन 1 और स्टेबल डिफ्यूजन 2 द्वारा उत्पन्न छवि के लिए प्रतिनिधि छवियां और उनके सामान्यीकृत एकीकृत ग्रेडिएंट दिखाए गए हैं। सभी मामलों में, हम देखते हैं कि बड़े ग्रेडिएंट के अनुरूप सबसे प्रासंगिक पिक्सेल मुख्य रूप से चेहरे के क्षेत्र और त्वचा के अन्य क्षेत्रों के आसपास केंद्रित होते हैं।

4.2. तुलना

क्योंकि यह विशेष रूप से GAN-जनरेटेड चेहरों का पता लगाने पर केंद्रित था, इसलिए [23] का काम हमारे काम से सबसे सीधे जुड़ा हुआ है। इस काम में, लेखक दिखाते हैं कि एक कम-आयामी रैखिक मॉडल स्टाइलगैन-जनरेटेड चेहरों के सामान्य चेहरे के संरेखण को पकड़ता है। 3,000 स्टाइलगैन चेहरों के खिलाफ मूल्यांकन किया गया, उनका मॉडल 99.5% GAN चेहरों को सही ढंग से वर्गीकृत करता है, जबकि 1% वास्तविक चेहरों को गलत तरीके से AI के रूप में वर्गीकृत किया जाता है। तुलना करके, हम एक समान TPR प्राप्त करते हैं, लेकिन कम 0.5% FPR के साथ।


हालाँकि, हमारे दृष्टिकोण के विपरीत, जो अन्य GAN चेहरों जैसे कि generated.photos के लिए सामान्यीकृत है, इस पहले के काम के लिए TPR 86.0% (उसी 1% FPR के साथ) तक गिर जाता है। इसके अलावा, यह पहले का काम प्रसार-आधारित चेहरों का पता लगाने में विफल रहता है क्योंकि इन चेहरों में स्टाइलगैन चेहरों के समान संरेखण आर्टिफैक्ट नहीं होता है। तुलना करके, हमारी तकनीक GAN- और प्रसार-जनित चेहरों और प्रशिक्षण में नहीं देखे गए संश्लेषण इंजनों में सामान्यीकृत होती है।


हमने हाल ही में एक अत्याधुनिक मॉडल का भी मूल्यांकन किया जो AI द्वारा उत्पन्न छवियों में फूरियर कलाकृतियों की उपस्थिति का फायदा उठाता है [8]। वास्तविक और इन-इंजन AI द्वारा उत्पन्न चेहरों के हमारे मूल्यांकन डेटासेट पर यह मॉडल 0.5% के समान FPR पर AI द्वारा उत्पन्न चेहरों में से केवल 23.8% को सही ढंग से वर्गीकृत करता है। यह TPR हमारे मॉडल के 98.0% के TPR से काफी कम है और [8] में बताए गए 90% TPR से भी कम है। हमारा अनुमान है कि यह विसंगति हमारे डेटासेट की अधिक विविधतापूर्ण और चुनौतीपूर्ण इन-द-वाइल्ड वास्तविक छवियों के कारण है।


यह पेपर CC 4.0 लाइसेंस के अंतर्गत arxiv पर उपलब्ध है।


[8] ट्रू पॉज़िटिव रेट (टीपीआर) एआई-जनरेटेड फ़ोटो का वह अंश है जिसे सही ढंग से वर्गीकृत किया गया है।


[9] झूठी सकारात्मक दर (एफपीआर) वास्तविक तस्वीरों का वह अंश है जिसे गलत तरीके से वर्गीकृत किया गया है।

L O A D I N G
. . . comments & more!

About Author

BotBeat.Tech: Trusted Generative AI Research Firm HackerNoon profile picture
BotBeat.Tech: Trusted Generative AI Research Firm@botbeat
"BotBeat is an AI Research Goldmine" - said real person talking to a bot on Twitter/X/Gronk/WhateverWeAreCallingIt

लेबल

इस लेख में चित्रित किया गया था...

Read on Terminal Reader
Read this story in a terminal
 Terminal
Read this story w/o Javascript
Read this story w/o Javascript
 Lite
X REMOVE AD