paint-brush
आर्टिफिशियल इंटेलिजेंस द्वारा उत्पन्न टेक्स्ट का पता कैसे लगाएंद्वारा@mcsee
9,701 रीडिंग
9,701 रीडिंग

आर्टिफिशियल इंटेलिजेंस द्वारा उत्पन्न टेक्स्ट का पता कैसे लगाएं

द्वारा Maximiliano Contieri6m2023/02/03
Read on Terminal Reader

बहुत लंबा; पढ़ने के लिए

ट्यूरिंग टेस्ट पर एक ट्यूरिंग टेस्ट टीएल; डीआर: एआई का पता लगाने के लिए एक नया उपकरण। जनरेट किए गए टेक्स्ट.एमई: समझाएं कि एआई टेक्स्ट जनरेट कैसे करेंचैटजीपीटी: एआई-जेनरेट किए गए टेक्स्ट का पता लगाना चुनौतीपूर्ण हो सकता है, लेकिन कई तरीके हैं जिनका इस्तेमाल किया जा सकता है।
featured image - आर्टिफिशियल इंटेलिजेंस द्वारा उत्पन्न टेक्स्ट का पता कैसे लगाएं
Maximiliano Contieri HackerNoon profile picture

ट्यूरिंग टेस्ट पर एक ट्यूरिंग टेस्ट

टीएल; डीआर: एआई उत्पन्न ग्रंथों का पता लगाने के लिए एक नया उपकरण।


टेक्स्ट जेनरेटर और टेक्स्ट डिटेक्टर 😾बिल्ली और माउस🐁 के खेल की तरह हैं।


🤖कृत्रिम बुद्धिमत्ता उपकरण और विशेष रूप से जीपीटी मॉडल मानव नौकरियों की जगह ले रहे हैं।


👨‍💻खराब प्रोग्रामर भी जल्द ही बदल दिए जाएंगे।


वहाँ कई कृत्रिम बुद्धि साहित्यिक चोरी उपकरण थे।


अब, open.ai के लोकप्रिय चैटजीपीटी मॉडल ने अपना खुद का जारी किया।


पूरा ब्लॉग पोस्ट यहाँ है:

https://openai.com/blog/new-ai-classifier-for-indicating-ai-लिखित-पाठ/


चलो यह कोशिश करते हैं:

1. मेरा मूल स्पष्टीकरण जांचें

( ChatGPT के स्पष्टीकरण को पढ़े बिना मैंने इसे अपने अनुभव से लिखा है)


उत्पन्न एआई पाठ का पता कैसे लगाएं।


आर्टिफिशियल इंटेलिजेंस पूर्व-प्रशिक्षित मॉडल का उपयोग करके टेक्स्ट उत्पन्न कर सकता है।


ये मॉडल सार्वजनिक डोमेन ग्रंथों पर आधारित हैं और अवधारणाओं के बीच संबंधों की भविष्यवाणी करके ज्ञान पैदा कर सकते हैं।


आर्टिफिशियल इंटेलिजेंस द्वारा उत्पन्न सिंथेटिक ग्रंथ बिना सूत्रों को उद्धृत किए तथ्य देते हैं। कभी-कभी वे व्याख्याओं में बहुत गहरे नहीं होते जब तक कि हमें परिशोधन की आवश्यकता न हो।


जेनरेट किए गए टेक्स्ट का पता लगाने का एक सरल तरीका कई ज्ञात जेनरेटर की तुलना करना और उन्हें वांछित टेक्स्ट लिखने के लिए कहना है।


एक और संकेत यह देखने के लिए कुछ व्याकरण की गलतियों को जोड़ना होगा कि क्या उपकरण अपने डेटासेट को समझता है क्योंकि केवल मनुष्य ही गलतियाँ करते हैं।


यदि आप आर्टिफिशियल इंटेलिजेंस द्वारा उत्पन्न कई ग्रंथों को पढ़ते हैं, तो आप देखेंगे कि वे समान व्याकरण पैटर्न का उपयोग करते हैं।


आप जनरेटर को अन्य दर्शकों को लक्षित करने, सक्रिय आवाजों का उपयोग करने आदि का निर्देश दे सकते हैं।


फिर आप शब्दों की दूरी, सामान्य शब्दों आदि को माप सकते हैं।


एक अनुमानित सीमा के साथ इसकी तुलना करने के बाद, आप जाँच सकते हैं कि हम कितने आश्वस्त हैं कि पाठ किसी मनुष्य द्वारा उत्पन्न नहीं किया गया था।


उपरोक्त पाठ को मैंने अकेले लिखा है, और HemingwayApp या Grammarly जैसे कई लेखन सहायक उपकरणों का उपयोग करने के बाद, मैंने इसे यहाँ एकदम नए टूल में डाल दिया है।


नतीजा: क्लासिफायरियर टेक्स्ट को एआई-जेनरेट किए जाने की संभावना नहीं मानता है। 😺


मैंने ट्यूरिंग टेस्ट पास किया। 😺🧠


पैमाना होना:

"एआई-जेनरेट होने की बहुत संभावना नहीं है" <0.1 के क्लासिफायर थ्रेसहोल्ड से मेल खाती है। हमारे चुनौती सेट से लगभग 5% मानव-लिखित पाठ और 2% AI-जनित पाठ में यह लेबल है।


"एआई-जनित होने की संभावना नहीं" 0.1 और 0.45 के बीच एक क्लासिफायर थ्रेशोल्ड से मेल खाती है। हमारे चुनौती सेट से लगभग 15% मानव-लिखित और 10% AI-जनित पाठ में यह लेबल है।


"अस्पष्ट अगर यह एआई लिखा है" 0.45 और 0.9 के बीच एक क्लासिफायर थ्रेशोल्ड से मेल खाती है। हमारे चुनौती सेट से लगभग 50% मानव-लिखित पाठ और 34% AI-जनित पाठ में यह लेबल है।


"संभवतः एआई-जनित" 0.9 और 0.98 के बीच एक क्लासिफायर थ्रेशोल्ड से मेल खाती है। हमारे चुनौती सेट से लगभग 21% मानव-लिखित पाठ और 28% AI-जनित पाठ में यह लेबल है।


"संभावित एआई-जेनरेट" क्लासिफायर थ्रेशोल्ड> 0.98 से मेल खाता है। हमारे चुनौती सेट से लगभग 9% मानव-लिखित पाठ और 26% AI-जनित पाठ में यह लेबल है।

2. चैटजीपीटी के स्पष्टीकरण की जांच करें

ME: समझाएं कि उत्पन्न AI टेक्स्ट का पता कैसे लगाया जाए


चैटजीपीटी: एआई-जनित पाठ का पता लगाना चुनौतीपूर्ण हो सकता है, लेकिन कई तरीके हैं जिनका उपयोग किया जा सकता है:


पैटर्न पहचान: एआई-जनित पाठ अक्सर वाक्य संरचना, भाषा उपयोग और शब्द पसंद में पैटर्न प्रदर्शित करता है जो मानव-लिखित पाठ की तुलना में विशिष्ट हो सकता है।


सांख्यिकीय विश्लेषण: एआई-जनित पाठ का विश्लेषण कुछ सांख्यिकीय विशेषताओं जैसे चरित्र और शब्द आवृत्ति, और एन-ग्राम वितरण के लिए किया जा सकता है जो मानव-लिखित पाठ से अलग हैं।


मानव मूल्यांकन: कुछ मामलों में, मानव विशेषज्ञ पाठ की समीक्षा कर सकते हैं और यह निर्धारित कर सकते हैं कि यह मानव द्वारा लिखा गया था या एआई द्वारा उनके अनुभव और विशेषज्ञता के आधार पर उत्पन्न किया गया था।


एआई मॉडल का उपयोग: एआई मॉडल को मानव-लिखित और एआई-जेनरेट किए गए टेक्स्ट के लेबल किए गए डेटासेट का उपयोग करके एआई-जेनरेट किए गए टेक्स्ट की पहचान करने के लिए प्रशिक्षित किया जा सकता है। इसके बाद मॉडल का उपयोग नए, अनदेखे टेक्स्ट में एआई-जेनरेट किए गए टेक्स्ट की पहचान करने के लिए किया जा सकता है।


यह ध्यान देने योग्य है कि AI तकनीक का विकास जारी है, और टेक्स्ट जनरेट करने के लिए नए तरीके विकसित किए जा रहे हैं, इसलिए ये तरीके हमेशा फुलप्रूफ नहीं हो सकते हैं।


अच्छी व्याख्या। आइए फिर से टूल का उपयोग करें।


परिणाम: क्लासिफायरियर टेक्स्ट को संभवतः एआई-जनित मानता है।😂


मॉडल में > 0.9 सटीकता है जो आर्टिफिशियल इंटेलिजेंस ने इसे उत्पन्न किया।


यह अपेक्षित था।

3. विकिपीडिया की व्याख्या की जाँच करें

आइए इस लेख को काट कर चिपकाएँ।


"प्राकृतिक भाषा पीढ़ी (एनएलजी) एक सॉफ्टवेयर प्रक्रिया है जो प्राकृतिक भाषा उत्पादन का उत्पादन करती है। एनएलजी विधियों के एक व्यापक रूप से उद्धृत सर्वेक्षण ने एनएलजी को "कृत्रिम बुद्धि और कम्प्यूटेशनल भाषा विज्ञान के उपक्षेत्र के रूप में वर्णित किया है जो कंप्यूटर सिस्टम के निर्माण से संबंधित है जो सूचना के कुछ अंतर्निहित गैर-भाषाई प्रतिनिधित्व से अंग्रेजी या अन्य मानव भाषाओं में समझने योग्य ग्रंथों का उत्पादन कर सकता है"। .


हालांकि यह व्यापक रूप से सहमत है कि किसी भी एनएलजी प्रक्रिया का आउटपुट पाठ है, इस बारे में कुछ असहमति है कि एनएलजी प्रणाली के इनपुट को गैर-भाषाई होने की आवश्यकता है या नहीं। एनएलजी विधियों के सामान्य अनुप्रयोगों में विभिन्न रिपोर्टों का उत्पादन शामिल है, उदाहरण के लिए मौसम और रोगी रिपोर्ट; छवि कैप्शन; और चैटबॉट्स।


स्वचालित एनएलजी की तुलना उस प्रक्रिया से की जा सकती है जिसका उपयोग मानव तब करता है जब वे विचारों को लेखन या भाषण में बदलते हैं। मनोवैज्ञानिक इस प्रक्रिया के लिए भाषा उत्पादन शब्द पसंद करते हैं, जिसे गणितीय शब्दों में भी वर्णित किया जा सकता है, या मनोवैज्ञानिक अनुसंधान के लिए एक कंप्यूटर में प्रतिरूपित किया जा सकता है।


एनएलजी सिस्टम की तुलना कृत्रिम कंप्यूटर भाषाओं के अनुवादकों से भी की जा सकती है, जैसे डीकंपलर या ट्रांसपिलर, जो एक मध्यवर्ती प्रतिनिधित्व से उत्पन्न मानव-पठनीय कोड भी उत्पन्न करते हैं।


मानव भाषाएं काफी अधिक जटिल होती हैं और प्रोग्रामिंग भाषाओं की तुलना में अधिक अस्पष्टता और अभिव्यक्ति की विविधता की अनुमति देती हैं, जो एनएलजी को अधिक चुनौतीपूर्ण बनाती है।


परिणाम: यदि एआई-जनित है तो क्लासिफायरियर पाठ को अस्पष्ट मानता है। 📚


आत्मविश्वास 0.45 और 0.9 के बीच है।


पृष्ठ केइतिहास को देखते हुए, हम कई मनुष्यों को देखते हैं और इतने सारे बॉट्स को नहीं।


मेरा निष्कर्ष यह है कि चैटजीपीटी को आंशिक रूप से पाठ के साथ खिलाया गया था, इसलिए यह ओवरफिटिंग को माप रहा है।

4. मानव संपादन के साथ चैटजीपीटी की जांच करें

मैंने चैटजीपीटी द्वारा उत्पन्न पाठ लिया और इसे अपने संपादक टूल के साथ स्वयं संपादित किया।


एआई-जनित पाठ का पता लगाना चुनौतीपूर्ण हो सकता है, लेकिन आप कई विधियों का उपयोग कर सकते हैं।


आप मानव-लिखित और एआई-जनित पाठ के लेबल वाले डेटासेट का उपयोग करके एआई-जनित पाठ की पहचान करने के लिए प्रशिक्षण द्वारा एआई मॉडल का उपयोग भी कर सकते हैं।


आप पैटर्न पहचान का उपयोग कर सकते हैं क्योंकि एआई-जनित पाठ अक्सर वाक्य संरचना, भाषा उपयोग और शब्द पसंद में पैटर्न प्रदर्शित करता है जो मानव-लिखित पाठ की तुलना में विशिष्ट हो सकता है।


इसके अलावा, एक मानव मूल्यांकन है, जहां कुछ मामलों में, मानव विशेषज्ञ पाठ की समीक्षा कर सकते हैं और यह निर्धारित कर सकते हैं कि क्या यह मानव द्वारा उनके अनुभव और विशेषज्ञता के आधार पर लिखा गया था।


आप कुछ सांख्यिकीय विशेषताओं जैसे चरित्र और शब्द आवृत्ति, और एन-ग्राम वितरण जो मानव-लिखित पाठ से भिन्न हैं, के लिए AI-जनित पाठ की जाँच करने के लिए सांख्यिकीय विश्लेषण नामक एक उपकरण का उपयोग कर सकते हैं।


आप मॉडल का उपयोग करके एआई-जेनरेट किए गए टेक्स्ट को नए और अनदेखे टेक्स्ट में पहचान सकते हैं।


अंत में, एआई तकनीक तेजी से विकसित हो रही है, और पाठ उत्पन्न करने के लिए नए तरीके हैं जो हमेशा फुलप्रूफ नहीं हो सकते हैं।


परिणाम: क्लासिफायरियर टेक्स्ट को संभवतः एआई-जनित मानता है। 👿


मैं सिस्टम को मूर्ख नहीं बना सका।

5. मेरे पिछले लेख देखें

मैंने अपने कई लेखों की जाँच के लिए टूल का उपयोग किया:


ChatGPT: एक +25 वर्षीय वरिष्ठ प्रोग्रामर का आश्चर्यजनक शिक्षक


परिणाम: वर्गीकारक पाठ को असंभाव्य एआई-उत्पन्न होने वाला मानता है। 😃


कठिनाई के 5 स्तरों में व्याख्या करें: चैटजीपीटी


परिणाम: यदि यह एआई-जनित है तो क्लासिफायरियर पाठ को अस्पष्ट मानता है।


यह सटीक है। मैंने कुछ विचार प्राप्त करने के लिए चैटजीपीटी से "बात" की। 😳


GitHub Copilot आपकी नौकरी के लिए खतरा क्यों नहीं है


परिणाम: क्लासिफायरियर टेक्स्ट को एआई-जेनरेट किए जाने की संभावना नहीं मानता है। 😃


☝️ आप अपने लेख आजमा सकते हैं!

अंतिम विचार

यह Open.ai का एक और अद्भुत टूल है।


आधिकारिक पृष्ठ में सटीकता, नियतत्ववाद और मूल्यांकन पर कुछ बहुत ही रोचक विवरण हैं।