paint-brush
एमएल सिस्टम के लिए FaaS आर्किटेक्चर और सत्यापन योग्य निष्पक्षताद्वारा@escholar
285 रीडिंग

एमएल सिस्टम के लिए FaaS आर्किटेक्चर और सत्यापन योग्य निष्पक्षता

बहुत लंबा; पढ़ने के लिए

यह खंड एक सेवा के रूप में निष्पक्षता (एफएएएस) की वास्तुकला को उजागर करता है, जो मशीन लर्निंग के भीतर निष्पक्षता ऑडिट में विश्वास सुनिश्चित करने के लिए एक क्रांतिकारी प्रणाली है। चर्चा में खतरा मॉडल, प्रोटोकॉल अवलोकन और आवश्यक चरण शामिल हैं: सेटअप, क्रिप्टोग्राम पीढ़ी और निष्पक्षता मूल्यांकन। FaaS एक मजबूत दृष्टिकोण पेश करता है, जिसमें क्रिप्टोग्राफ़िक प्रमाण और सत्यापन योग्य कदम शामिल हैं, जो एमएल परिदृश्य में निष्पक्ष मूल्यांकन के लिए एक सुरक्षित आधार प्रदान करता है।
featured image - एमएल सिस्टम के लिए FaaS आर्किटेक्चर और सत्यापन योग्य निष्पक्षता
EScholar: Electronic Academic Papers for Scholars HackerNoon profile picture

यह पेपर CC BY 4.0 DEED लाइसेंस के तहत arxiv पर उपलब्ध है।

लेखक:

(1) एहसान तोरेनी, सरे विश्वविद्यालय, यूके;

(2) मरियम मेहरनेज़ाद, रॉयल होलोवे यूनिवर्सिटी ऑफ़ लंदन;

(3) एड वान मूरसेल, बर्मिंघम विश्वविद्यालय।

लिंक की तालिका

सार एवं परिचय

पृष्ठभूमि और संबंधित कार्य

FaaS वास्तुकला

कार्यान्वयन और प्रदर्शन विश्लेषण

निष्कर्ष

पावती और संदर्भ

3 FaaS वास्तुकला

इस अनुभाग में, हम अपने सिस्टम की वास्तुकला प्रस्तुत करते हैं (चित्र 1) और इसकी विशेषताओं का वर्णन करते हैं। FaaS आर्किटेक्चर में हितधारकों को तीन भूमिकाओं में शामिल किया गया है: ए) एमएल सिस्टम: एक सिस्टम जो डेटा और एमएल एल्गोरिदम का मालिक है, बी) फेयरनेस ऑडिटर सर्विस: एक सेवा जो एमएल सिस्टम के निष्पक्ष प्रदर्शन की गणना करती है, और सी) यूनिवर्सल वेरिफायर: कोई भी जिसके पास ऑडिटिंग प्रक्रिया को सत्यापित करने के लिए तकनीकी विशेषज्ञता और प्रेरणा है।

3.1 ख़तरा मॉडल

संबंधित प्रोटोकॉल भूमिकाओं (एमएल सिस्टम, फेयरनेस ऑडिटर सर्विस और यूनिवर्सल वेरिफायर) को लागू करने वाले दलों की सुरक्षा का डिजाइन और कार्यान्वयन (छवि 1) एक दूसरे से स्वतंत्र हैं। भूमिकाओं के बीच होने वाला अंतर-संचार यह मानता है कि पार्टियों के बीच कोई भरोसा नहीं है; इस प्रकार, उनके सभी दावों के साथ सत्यापन प्रमाण होना चाहिए (जिसके लिए हम ZKP का उपयोग करेंगे)। हम मानते हैं कि ऑडिटर सिस्टम विभिन्न हमलों के प्रति संवेदनशील है और भरोसेमंद नहीं है। इस प्रकार, फेयरनेस ऑडिटर सिस्टम पर संग्रहीत डेटा सभी चरणों में एन्क्रिप्टेड, छेड़छाड़-प्रूफ और सत्यापन योग्य होना चाहिए। इसके अलावा, हम मानते हैं कि एमएल सिस्टम और निष्पक्षता लेखा परीक्षक के बीच संचार चैनल सुरक्षित नहीं है। इसलिए, ट्रांसमिशन शुरू होने से पहले संवेदनशील डेटा को एन्क्रिप्ट किया जाना चाहिए। हालाँकि, प्रोटोकॉल अनुक्रम में प्री-सेटिंग चरण में क्रिप्टोग्राफ़िक प्रिमिटिव पर एक समझौता होगा।


FaaS में, हम मानते हैं कि ML सिस्टम डेटासेट नमूनों के मूल लेबल के क्रिप्टोग्राम भेजने में ईमानदार है। कोई ऐसी धारणा के खिलाफ तर्क दे सकता है और चर्चा कर सकता है कि एमएल प्रणाली डेटासेट के वास्तविक लेबल को संशोधित करके ऑडिटर सेवा और सत्यापनकर्ताओं को धोखा देने का इरादा कर सकती है। उदाहरण के लिए, एमएल प्रणाली वास्तविक लेबल और पूर्वानुमानित लेबल के क्रिप्टोग्राम को यथासंभव एक-दूसरे के समान प्रदान करेगी ताकि ऑडिटर यह निष्कर्ष निकाले कि एल्गोरिदम निष्पक्ष हैं। यह आगे के शोध के लिए एक दिलचस्प क्षेत्र है। उदाहरण के लिए, इसे स्वतंत्र रूप से ऑडिटर सेवा को वास्तविक लेबल के क्रिप्टोग्राम प्रदान करके संबोधित किया जा सकता है, उदाहरण के लिए सत्यापनकर्ता के पास एक डेटासेट हो सकता है जो वह एमएल सिस्टम को प्रदान करता है। फिर सत्यापनकर्ता वास्तविक लेबल के लिए वांछित मान अलग से तय करता है और इन्हें ऑडिटर सेवा को फीड करता है। इस तरह, एमएल सिस्टम के लिए यह बहुत कम स्पष्ट है कि ऑडिटर को भेजे गए डेटा में हेरफेर कैसे किया जाए, क्योंकि कुछ लेबल कहीं और से आते हैं।


भूमिकाओं की आंतरिक सुरक्षा FaaS से परे है। एमएल प्रणाली को अपने डेटा और एल्गोरिदम की सुरक्षा के लिए अतिरिक्त उपायों पर विचार करने की आवश्यकता है। हम मानते हैं कि एमएल प्रणाली डेटा और भविष्यवाणियों को ईमानदारी से प्रस्तुत करती है। यह एक उचित धारणा है क्योंकि नैतिक रूप से प्रदर्शन करने के लिए प्रोत्साहन निष्पक्षता ऑडिटिंग प्रक्रिया में भाग लेने पर बेईमान होने के विपरीत है। चर्चा अनुभाग में इस पर अधिक चर्चा की गई है।


तालिका 2: मूल डेटा में किसी प्रविष्टि के 3-बिट प्रतिनिधित्व के संभावित क्रमपरिवर्तन।

3.2 प्रोटोकॉल अवलोकन

मुख्य सुरक्षा प्रोटोकॉल अनुक्रम एमएल सिस्टम और फेयरनेस ऑडिटिंग सर्विस या संक्षिप्त रूप में ऑडिटर के बीच है। ध्यान दें कि यद्यपि हम अपनी वास्तुकला में तीन भूमिकाओं का सुझाव देते हैं, संचार मुख्य रूप से उपरोक्त दो भूमिकाओं के बीच होता है, और कोई भी सार्वभौमिक सत्यापनकर्ता ऑडिटर सेवा (जो निष्पक्षता बोर्ड का प्रतिनिधित्व करता है) की ओर रुख कर सकता है, यदि वे गणनाओं को चुनौती देना चाहते हैं।


एमएल सिस्टम एमएल एल्गोरिदम के कार्यान्वयन और निष्पादन के लिए जिम्मेदार है। इसमें इनपुट के रूप में डेटा है और कुछ भविष्यवाणी करता है (उपयोग के मामले और उद्देश्य के आधार पर) जो आउटपुट बनाता है (चित्र 1)। फेयरनेस ऑडिटर सेवा एमएल सिस्टम से जानकारी प्राप्त करती है, निष्पक्षता मीट्रिक की गणना करके इसके निष्पक्षता प्रदर्शन का मूल्यांकन करती है। फिर, यह मीट्रिक के परिणाम को एमएल सिस्टम पर वापस लौटाता है। यह सार्वजनिक सत्यापन के लिए निष्पक्षता बोर्ड में गणनाओं को भी प्रकाशित करता है। सार्वजनिक निष्पक्षता बोर्ड एक सार्वजनिक रूप से सुलभ, केवल-पढ़ने योग्य निष्पक्षता बोर्ड (उदाहरण के लिए एक वेबसाइट) है। ऑडिटर को केवल निष्पक्षता बोर्ड में डेटा (और पर्याप्त सबूत) संलग्न करने का अधिकार है। साथ ही, ऑडिटर डेटा को प्रकाशित करने से पहले उसकी प्रामाणिकता, शुद्धता और अखंडता की पुष्टि करता है।

3.3 प्रोटोकॉल अनुक्रम

इस प्रोटोकॉल के तीन चरण हैं: सेटअप, क्रिप्टोग्राम जेनरेशन और निष्पक्षता मीट्रिक गणना।

3.3.1 चरण I: सेटअप

इस चरण में, एमएल सिस्टम और ऑडिटर प्रारंभिक सेटिंग्स पर सहमत होते हैं। हम मानते हैं कि प्रोटोकॉल मल्टीप्लिकेटिव चक्रीय समूह सेटिंग (यानी डिजिटल सिग्नेचर एल्गोरिदम (डीएसए) जैसे समूह [18]) में कार्य करता है, लेकिन यह योगात्मक चक्रीय समूहों (यानी एलिप्टिक कर्व डिजिटल सिग्नेचर एल्गोरिदम (ईसीडीएसए) जैसे समूहों [18] में भी कार्य कर सकता है। ]). ऑडिटर और एमएल सिस्टम प्रोटोकॉल की शुरुआत से पहले सार्वजनिक रूप से (पी, क्यू, जी) पर सहमत होते हैं। मान लीजिए कि p और q दो बड़े अभाज्य अभाज्य संख्याएँ हैं जहाँ q|(p − 1)। गुणक चक्रीय समूह (Z * p) में, Gq अभाज्य क्रम q का एक उपसमूह है और g इसका जनक है। सरलता के लिए, हम मानते हैं कि डिसीजन डिफी-हेलमैन (डीडीएच) समस्या दायरे से बाहर है [31]।

इसके बाद, एमएल सिस्टम डीएसए या ईसीडीएसए का उपयोग करके एक सार्वजनिक/निजी जोड़ी कुंजी उत्पन्न करता है और सार्वजनिक कुंजी को निष्पक्षता बोर्ड में प्रकाशित करता है। निजी कुंजी जोड़ी की सुरक्षा एमएल सिस्टम की सुरक्षा वास्तुकला पर निर्भर करती है और हम मानते हैं कि निजी कुंजी को औद्योगिक मानक अभ्यास में सुरक्षित रूप से संग्रहीत किया जाता है (उदाहरण के लिए बोर्ड पर सुरक्षित मेमोरी मॉड्यूल का उपयोग करना)।


क्रिप्टोग्राम तालिका: प्रारंभिक समझौतों के बाद, एमएल प्रणाली अपने परीक्षण डेटासेट में नमूनों की संख्या के अनुरूप एन पंक्तियों के साथ एक क्रिप्टोग्राम तालिका तैयार करती है। हम इस पेपर के शेष भाग में इस तालिका को क्रिप्टोग्राम तालिका के रूप में संदर्भित करेंगे। यदि एमएल सिस्टम परीक्षण सेट में नमूनों की संख्या प्रकट नहीं करना चाहता है, तो ऑडिटर और एमएल सिस्टम सार्वजनिक रूप से एन पर सहमत हो सकते हैं। इस मामले में, n इतना बड़ा होना चाहिए कि सार्वभौमिक सत्यापनकर्ता परिणाम से संतुष्ट हों।


क्रिप्टोग्राम तालिका में प्रत्येक पंक्ति तीन मापदंडों का सारांश देती है: (1) संरक्षित समूह सदस्यता स्थिति, (2) इसका वास्तविक लेबल और (3) एमएल मॉडल द्वारा अनुमानित लेबल। प्रत्येक पंक्ति में इसकी शुद्धता के प्रमाण के साथ तीन मापदंडों का एन्क्रिप्टेड प्रारूप होता है। सेटअप चरण में एक क्रिप्टोग्राम तालिका तालिका 3 में दिखाई गई है। सरलतम मामले में, प्रत्येक पैरामीटर बाइनरी है। इसलिए, संयुक्त पैरामीटर कुल मिलाकर आठ क्रमपरिवर्तन उत्पन्न करेंगे। सेटअप चरण में, प्रत्येक डेटा नमूने के लिए सभी आठ संभावित क्रमपरिवर्तन और उनके प्रमाण शामिल करने के लिए तालिका तैयार की जाती है। क्रमपरिवर्तन की कुल संरचना तालिका 2 में दिखाई गई है। प्रत्येक पंक्ति चार गुणों को संतुष्ट करेगी: (ए) कोई आसानी से सत्यापित कर सकता है कि क्या एक एकल क्रिप्टोग्राम आठ संभावित क्रमपरिवर्तनों में से एक का एन्क्रिप्टेड संस्करण है, (बी) सत्यापन योग्य होने पर, यदि केवल एक एकल क्रिप्टोग्राम चयनित, कोई यह नहीं बता सकता कि वर्तमान क्रिप्टोग्राम किस क्रमपरिवर्तन का प्रतिनिधित्व करता है, (सी) एक ही पंक्ति से चुने गए प्रत्येक दो क्रिप्टोग्राम के लिए, कोई भी प्रत्येक को एक दूसरे से अलग करने में सक्षम होगा, और (डी) क्रिप्टोग्राम का एक सेट मनमाने ढंग से चयन करें एक सेट के रूप में प्रत्येक पंक्ति से, कोई आसानी से जांच सकता है कि सेट में प्रत्येक "क्रमपरिवर्तन" के लिए कितने मामले हैं।


क्रिप्टोग्राम तालिका फ़ंक्शंस की पीढ़ी निम्नलिखित अनुक्रम पर आधारित है:


चरण (1): प्रत्येक n नमूने के लिए, सिस्टम एक यादृच्छिक सार्वजनिक कुंजी g xi उत्पन्न करता है जहां xi निजी कुंजी है और xi ∈ [1, q - 1] है।


चरण (3): बाइनरी एन्कोडिंग के दशमलव मान के बराबर संबंधित कॉलम संख्या को निष्पक्षता ऑडिटिंग तालिका को पूरा करने के लिए क्रिप्टोग्राम तालिका से चुना जाता है (जैसा कि तालिका 2 में दिखाया गया है)।


अंत में, उत्पन्न निष्पक्षता ऑडिटिंग तालिका को एमएल सिस्टम द्वारा डिजिटल रूप से हस्ताक्षरित किया जाता है और फिर फेयरनेस ऑडिटिंग सेवा पर भेजा जाता है।

3.3.3 चरण III: निष्पक्षता मूल्यांकन

सबसे पहले, निष्पक्षता ऑडिटिंग सेवा निष्पक्षता ऑडिटिंग तालिका प्राप्त करती है, डिजिटल हस्ताक्षर और ZKPs का सत्यापन करती है, और निष्पक्षता बोर्ड में सामग्री प्रकाशित करती है।


इस बिंदु पर, हम इनमें से प्रत्येक समीकरण घटक को एक साथ तुलना करने के लिए विस्तारित करते हैं।


यह प्रक्रिया कम्प्यूटेशनल रूप से भारी है, खासकर जब निष्पक्षता ऑडिटिंग तालिका में डेटा नमूनों की संख्या बड़ी है। इस मामले में, निष्पक्षता लेखा परीक्षक क्रमपरिवर्तन संख्या की घोषणा को एमएल प्रणाली को सौंप सकता है। ऑडिटर को अभी भी निष्पक्षता ऑडिटिंग तालिका और प्रासंगिक ZKPs प्राप्त होते हैं। यह निष्पक्षता ऑडिटिंग तालिका को निष्पक्षता बोर्ड में संग्रहीत कर सकता है, निष्पक्षता की गणना कर सकता है, और घोषित क्रमपरिवर्तन संख्याओं की शुद्धता को सत्यापित कर सकता है। सार्वभौमिक सत्यापनकर्ता निष्पक्षता ऑडिटिंग तालिका के माध्यम से निष्पक्षता मीट्रिक गणनाओं को सत्यापित करने के लिए समान चरणों का पालन कर सकता है जो निष्पक्षता बोर्ड के माध्यम से सार्वजनिक रूप से पहुंच योग्य है।


इस चरण के अंत में, ऑडिटर निष्पक्षता मीट्रिक की गणना करने और जानकारी को सार्वजनिक रूप से जारी करने के लिए प्राप्त संख्याओं का उपयोग करता है। प्रत्येक क्रमपरिवर्तन की संख्या संरक्षित विशेषता वाले प्रत्येक समूह के लिए एमएल एल्गोरिदम के समग्र प्रदर्शन को दर्शाती है। तालिका 4 क्रमपरिवर्तन को दर्शाती है और यह एमएल प्रणाली की निष्पक्षता मीट्रिक से कैसे संबंधित है। क्रिप्टोग्राम तालिका और परिणाम निष्पक्षता बोर्ड पर प्रकाशित किए जाएंगे (चित्र 1)