paint-brush
FaaS আর্কিটেকচার এবং ML সিস্টেমের জন্য যাচাইযোগ্য ন্যায্যতাদ্বারা@escholar
285 পড়া

FaaS আর্কিটেকচার এবং ML সিস্টেমের জন্য যাচাইযোগ্য ন্যায্যতা

অতিদীর্ঘ; পড়তে

এই বিভাগটি ফেয়ারনেস অ্যাজ আ সার্ভিস (FaaS) এর আর্কিটেকচারকে উন্মোচন করে, যা মেশিন লার্নিং এর মধ্যে ন্যায্যতা নিরীক্ষার উপর আস্থা নিশ্চিত করার জন্য একটি বিপ্লবী ব্যবস্থা। আলোচনাটি হুমকির মডেল, প্রোটোকল ওভারভিউ এবং প্রয়োজনীয় পর্যায়গুলিকে অন্তর্ভুক্ত করে: সেটআপ, ক্রিপ্টোগ্রাম জেনারেশন এবং ন্যায্যতা মূল্যায়ন। FaaS একটি শক্তিশালী পদ্ধতির প্রবর্তন করে, ক্রিপ্টোগ্রাফিক প্রমাণ এবং যাচাইযোগ্য পদক্ষেপগুলিকে অন্তর্ভুক্ত করে, এমএল ল্যান্ডস্কেপে ন্যায্য মূল্যায়নের জন্য একটি নিরাপদ ভিত্তি প্রদান করে।
featured image - FaaS আর্কিটেকচার এবং ML সিস্টেমের জন্য যাচাইযোগ্য ন্যায্যতা
EScholar: Electronic Academic Papers for Scholars HackerNoon profile picture

এই কাগজটি CC BY 4.0 DEED লাইসেন্সের অধীনে arxiv-এ উপলব্ধ

লেখক:

(1) এহসান তোরেনি, ইউনিভার্সিটি অফ সারে, ইউকে;

(২) মরিয়ম মেহরনেজাদ, লন্ডনের রয়্যাল হলওয়ে ইউনিভার্সিটি;

(3) অ্যাড ভ্যান মুরসেল, বার্মিংহাম বিশ্ববিদ্যালয়।

লিঙ্কের টেবিল

বিমূর্ত এবং ভূমিকা

পটভূমি এবং সম্পর্কিত কাজ

FaaS আর্কিটেকচার

বাস্তবায়ন এবং কর্মক্ষমতা বিশ্লেষণ

উপসংহার

স্বীকৃতি এবং রেফারেন্স

3 FaaS আর্কিটেকচার

এই বিভাগে, আমরা আমাদের সিস্টেমের আর্কিটেকচার উপস্থাপন করি (চিত্র 1) এবং এর বৈশিষ্ট্যগুলি বর্ণনা করি। FaaS আর্কিটেকচারে স্টেকহোল্ডারদের তিনটি ভূমিকা রয়েছে: A) ML সিস্টেম: একটি সিস্টেম যা ডেটা এবং ML অ্যালগরিদমের মালিক, B) ফেয়ারনেস অডিটর পরিষেবা: একটি পরিষেবা যা ML সিস্টেমের ন্যায্য কর্মক্ষমতা গণনা করে, এবং C) সর্বজনীন যাচাইকারী: যে কেউ যার অডিটিং প্রক্রিয়া যাচাই করার প্রযুক্তিগত দক্ষতা এবং প্রেরণা রয়েছে।

3.1 হুমকি মডেল

সংশ্লিষ্ট প্রোটোকল ভূমিকা (এমএল সিস্টেম, ফেয়ারনেস অডিটর সার্ভিস, এবং ইউনিভার্সাল ভেরিফায়ার) (চিত্র 1) বাস্তবায়নকারী পক্ষগুলির নিরাপত্তার নকশা এবং বাস্তবায়ন একে অপরের থেকে স্বাধীন। ভূমিকাগুলির মধ্যে যে আন্তঃ-যোগাযোগগুলি ঘটে তা দলগুলির মধ্যে কোনও বিশ্বাসের অনুমান করে না; এইভাবে, তাদের সমস্ত দাবি অবশ্যই বৈধতা প্রমাণের সাথে থাকতে হবে (যার জন্য আমরা ZKP ব্যবহার করব)। আমরা ধরে নিই যে অডিটর সিস্টেম বিভিন্ন আক্রমণের জন্য ঝুঁকিপূর্ণ এবং বিশ্বাসযোগ্য নয়। এইভাবে, ফেয়ারনেস অডিটর সিস্টেমে সংরক্ষিত ডেটা অবশ্যই এনক্রিপ্ট করা, টেম্পার-প্রুফ এবং সব পর্যায়ে যাচাইযোগ্য হতে হবে। অধিকন্তু, আমরা অনুমান করি যে ML সিস্টেম এবং ন্যায্যতা নিরীক্ষকের মধ্যে যোগাযোগের চ্যানেল সুরক্ষিত নয়। অতএব, ট্রান্সমিশন শুরু হওয়ার আগে সংবেদনশীল ডেটা এনক্রিপ্ট করা আবশ্যক। যাইহোক, প্রোটোকল সিকোয়েন্সের প্রাক-সেটিং পর্যায়ে ক্রিপ্টোগ্রাফিক আদিম বিষয়ে একটি চুক্তি হবে।


FaaS-এ, আমরা ধরে নিই যে ML সিস্টেম ডেটাসেট নমুনার আসল লেবেলের ক্রিপ্টোগ্রাম পাঠানোর ক্ষেত্রে সৎ। কেউ এই ধরনের অনুমানের বিরুদ্ধে তর্ক করতে পারে এবং আলোচনা করতে পারে যে ML সিস্টেম অডিটর পরিষেবাকে প্রতারণা করতে পারে এবং ডেটাসেটের প্রকৃত লেবেলগুলিকে সংশোধন করে যাচাইকারীদের এক্সটেনশন করে। উদাহরণস্বরূপ, ML সিস্টেম প্রকৃত লেবেলগুলির ক্রিপ্টোগ্রাম এবং ভবিষ্যদ্বাণীকৃতগুলি একে অপরের সাথে যতটা সম্ভব সাদৃশ্যপূর্ণ প্রদান করবে যাতে অডিটর উপসংহারে অ্যালগরিদমগুলি ন্যায্য। এটি আরও গবেষণার জন্য একটি আকর্ষণীয় এলাকা। উদাহরণস্বরূপ, অডিটর পরিষেবাকে প্রকৃত লেবেলের ক্রিপ্টোগ্রামগুলি স্বাধীনভাবে প্রদান করে এটির সমাধান করা যেতে পারে যেমন যাচাইকারী একটি ML সিস্টেমকে সরবরাহ করে এমন একটি ডেটাসেটের মালিক হতে পারে। যাচাইকারী তারপর আলাদাভাবে প্রকৃত লেবেলগুলির জন্য পছন্দসই মানগুলি নির্ধারণ করে এবং সেগুলিকে অডিটর পরিষেবাতে ফিড করে৷ এইভাবে, এমএল সিস্টেমের কাছে এটি অনেক কম স্পষ্ট যে কীভাবে এটি নিরীক্ষকের কাছে পাঠানো ডেটা ম্যানিপুলেট করতে হয়, কারণ কিছু লেবেল অন্য কোথাও থেকে আসে।


ভূমিকাগুলির অভ্যন্তরীণ নিরাপত্তা FaaS এর বাইরে। এমএল সিস্টেম নিজেই তার ডেটা এবং অ্যালগরিদম রক্ষা করার জন্য অতিরিক্ত ব্যবস্থা বিবেচনা করতে হবে। আমরা অনুমান করি যে ML সিস্টেম সততার সাথে ডেটা এবং ভবিষ্যদ্বাণী উপস্থাপন করে। এটি একটি যুক্তিসঙ্গত অনুমান যেহেতু ন্যায্যতা নিরীক্ষা প্রক্রিয়ায় অংশগ্রহণ করার সময় নৈতিকভাবে কাজ করার জন্য প্রণোদনা অসৎ হওয়ার বিপরীতে। এটি আলোচনা বিভাগে আরও আলোচনা করা হয়েছে।


সারণী 2: মূল ডেটাতে একটি এন্ট্রির 3-বিট উপস্থাপনের সম্ভাব্য স্থানান্তর।

3.2 প্রোটোকল ওভারভিউ

প্রধান নিরাপত্তা প্রোটোকল ক্রম হল ML সিস্টেম এবং ফেয়ারনেস অডিটিং পরিষেবা বা সংক্ষিপ্ত আকারে নিরীক্ষকের মধ্যে। মনে রাখবেন যে যদিও আমরা আমাদের আর্কিটেকচারে তিনটি ভূমিকার পরামর্শ দিই, যোগাযোগগুলি প্রধানত উপরের দুটি ভূমিকার মধ্যে, এবং যেকোনো সার্বজনীন যাচাইকারী অডিটর পরিষেবাতে (যা ন্যায্যতা বোর্ডের প্রতিনিধিত্ব করে), যদি তারা গণনাকে চ্যালেঞ্জ করতে চায়।


এমএল সিস্টেম এমএল অ্যালগরিদম বাস্তবায়ন এবং কার্যকর করার জন্য দায়ী। এটিতে ইনপুট হিসাবে ডেটা রয়েছে এবং কিছু ভবিষ্যদ্বাণী করে (ব্যবহারের ক্ষেত্রে এবং উদ্দেশ্যের উপর নির্ভর করে) যা আউটপুট গঠন করে (চিত্র 1)। ফেয়ারনেস অডিটর পরিষেবা ML সিস্টেম থেকে তথ্য পায়, একটি ন্যায্যতা মেট্রিক গণনা করে এর ন্যায্যতা কর্মক্ষমতা মূল্যায়ন করে। তারপর, এটি ML সিস্টেমে মেট্রিকের জন্য ফলাফল ফেরত দেয়। এটি পাবলিক যাচাইকরণের জন্য একটি ন্যায্যতা বোর্ডে গণনাও প্রকাশ করে। পাবলিক ফেয়ারনেস বোর্ড হল একটি সর্বজনীনভাবে অ্যাক্সেসযোগ্য, শুধুমাত্র পঠনযোগ্য ফেয়ারনেস বোর্ড (যেমন একটি ওয়েবসাইট)। নিরীক্ষকের শুধুমাত্র ন্যায্যতা বোর্ডে ডেটা (এবং পর্যাপ্ত প্রমাণ) যুক্ত করার অধিকার রয়েছে। এছাড়াও, অডিটর এটি প্রকাশ করার আগে তথ্যের সত্যতা, সঠিকতা এবং অখণ্ডতা যাচাই করে।

3.3 প্রোটোকল সিকোয়েন্স

এই প্রোটোকলের তিনটি ধাপ রয়েছে: সেটআপ, ক্রিপ্টোগ্রাম জেনারেশন এবং ফেয়ারনেস মেট্রিক কম্পিউটেশন।

3.3.1 পর্যায় I: সেটআপ

এই পর্যায়ে, এমএল সিস্টেম এবং অডিটর প্রাথমিক সেটিংসে একমত। আমরা প্রোটোকল ফাংশনগুলি গুণিত চক্রীয় গ্রুপ সেটিং (যেমন ডিজিটাল সিগনেচার অ্যালগরিদম (DSA)-এর মতো গ্রুপ [18]) অনুমান করি, তবে এটি সংযোজন চক্রীয় গ্রুপগুলিতেও কাজ করতে পারে (যেমন উপবৃত্তাকার কার্ভ ডিজিটাল সিগনেচার অ্যালগরিদম (ECDSA)-এর মতো গ্রুপগুলি [18] ])। প্রোটোকল শুরুর আগে অডিটর এবং এমএল সিস্টেম সর্বজনীনভাবে (p, q, g) সম্মত হয়। ধরুন p এবং q দুটি বড় প্রাইম যেখানে q|(p − 1)। একটি গুণিত চক্রীয় গোষ্ঠীতে (Z ∗ p ), Gq হল মৌলিক ক্রম q এর একটি উপগোষ্ঠী এবং g হল এর জেনারেটর। সরলতার জন্য, আমরা ধরে নিই ডিসিশন ডিফি-হেলম্যান (ডিডিএইচ) সমস্যাটি সুযোগের বাইরে [৩১]।

এরপর, ML সিস্টেম DSA বা ECDSA ব্যবহার করে একটি পাবলিক/প্রাইভেট পেয়ার কী তৈরি করে এবং ফেয়ারনেস বোর্ডে পাবলিক কী প্রকাশ করে। প্রাইভেট কী জোড়ার সুরক্ষা ML সিস্টেমের নিরাপত্তা স্থাপত্যের উপর নির্ভর করে এবং আমরা অনুমান করি যে প্রাইভেট কী নিরাপদে একটি শিল্প মান অনুশীলনে সংরক্ষণ করা হয়েছে (যেমন বোর্ডে সুরক্ষিত মেমরি মডিউল ব্যবহার করে)।


ক্রিপ্টোগ্রাম টেবিল: প্রাথমিক চুক্তির পরে, ML সিস্টেম তাদের পরীক্ষার ডেটাসেটে নমুনার সংখ্যার সাথে সঙ্গতিপূর্ণ n সারি সহ একটি ক্রিপ্টোগ্রাম টেবিল তৈরি করে। আমরা এই কাগজের বাকি অংশে এই টেবিলটিকে ক্রিপ্টোগ্রাম টেবিল হিসাবে উল্লেখ করব। যদি এমএল সিস্টেম পরীক্ষার সেটে নমুনার সংখ্যা প্রকাশ করতে না চায়, তাহলে নিরীক্ষক এবং এমএল সিস্টেম প্রকাশ্যে এন-এ একমত হতে পারে। এই ক্ষেত্রে, n অবশ্যই যথেষ্ট বড় হতে হবে যাতে সার্বজনীন যাচাইকারীরা ফলাফলে সন্তুষ্ট হয়।


ক্রিপ্টোগ্রাম টেবিলের প্রতিটি সারি তিনটি পরামিতি সংক্ষিপ্ত করে: (1) সংরক্ষিত গোষ্ঠী সদস্যপদ, (2) এর প্রকৃত লেবেল এবং (3) ML মডেল দ্বারা পূর্বাভাসিত লেবেল। প্রতিটি সারিতে তিনটি প্যারামিটারের এনক্রিপ্ট করা বিন্যাস এবং এর সঠিকতার প্রমাণ রয়েছে। সেটআপ পর্বে একটি ক্রিপ্টোগ্রাম টেবিল সারণি 3 এ দেখানো হয়েছে। সহজ ক্ষেত্রে, প্রতিটি প্যারামিটার বাইনারি। অতএব, সম্মিলিত পরামিতিগুলি মোট আটটি স্থানান্তর তৈরি করবে। সেটআপ পর্বে, প্রতিটি ডেটা নমুনার জন্য সমস্ত আটটি সম্ভাব্য স্থানচ্যুতি এবং তাদের প্রমাণ ধারণ করার জন্য টেবিলটি তৈরি করা হয়। সারণি 2-এ স্থানান্তরগুলির মোট কাঠামো দেখানো হয়েছে। প্রতিটি সারি চারটি বৈশিষ্ট্য পূরণ করবে: (ক) একটি একক ক্রিপ্টোগ্রাম আটটি সম্ভাব্য স্থানচ্যুতিগুলির মধ্যে একটির এনক্রিপ্ট করা সংস্করণ কিনা তা সহজেই যাচাই করা যায়, (খ) যাচাইযোগ্য, যদি শুধুমাত্র একটি একক ক্রিপ্টোগ্রাম বেছে নেওয়া হয়েছে, বর্তমান ক্রিপ্টোগ্রামটি কোন পারমুটেশনগুলিকে প্রতিনিধিত্ব করে তা কেউ প্রয়োগ করতে পারে না, (গ) একটি একক সারি থেকে নির্বাচিত প্রতিটি দুটি ক্রিপ্টোগ্রামের জন্য, যে কেউ একে অপরের থেকে আলাদা করতে সক্ষম হবে, এবং (d) নির্বিচারে ক্রিপ্টোগ্রামের একটি সেট দেওয়া হয়েছে একটি সেট হিসাবে প্রতিটি সারি থেকে, কেউ সহজেই পরীক্ষা করতে পারে যে সেটটিতে প্রতিটি "পরিবর্তনের" জন্য কতগুলি কেস রয়েছে।


ক্রিপ্টোগ্রাম টেবিল ফাংশন প্রজন্ম নিম্নলিখিত ক্রম উপর ভিত্তি করে:


ধাপ (1): প্রতিটি n নমুনার জন্য, সিস্টেমটি একটি এলোমেলো পাবলিক কী তৈরি করে g xi যেখানে xi হল ব্যক্তিগত কী এবং xi ∈ [1, q − 1]।


ধাপ (৩): বাইনারি এনকোডিংয়ের দশমিক মানের সমান অনুরূপ কলাম নম্বরটি ন্যায্যতা নিরীক্ষণ টেবিলটি সম্পূর্ণ করতে ক্রিপ্টোগ্রাম টেবিল থেকে নির্বাচন করা হয়েছে (সারণি 2 এ দেখানো হয়েছে)।


অবশেষে, জেনারেট করা ফেয়ারনেস অডিটিং টেবিলটি এমএল সিস্টেম দ্বারা ডিজিটালভাবে স্বাক্ষরিত হয় এবং তারপর ফেয়ারনেস অডিটিং পরিষেবার মাধ্যমে পাঠানো হয়।

3.3.3 পর্যায় III: ন্যায্যতা মূল্যায়ন

প্রথমত, ন্যায্যতা নিরীক্ষণ পরিষেবা ন্যায্যতা নিরীক্ষণ টেবিল গ্রহণ করে, ডিজিটাল স্বাক্ষর এবং ZKPs যাচাই করে এবং ফেয়ারনেস বোর্ডে বিষয়বস্তু প্রকাশ করে।


এই মুহুর্তে, আমরা এই সমীকরণের প্রতিটি উপাদানকে একসাথে তুলনা করার জন্য প্রসারিত করি।


এই প্রক্রিয়াটি গণনাগতভাবে ভারী, বিশেষ করে যখন ন্যায্যতা নিরীক্ষণ টেবিলে ডেটা নমুনার সংখ্যা বেশি। এই ক্ষেত্রে, ন্যায্যতা নিরীক্ষক ML সিস্টেমে পারমুটেশন নম্বরের ঘোষণা অর্পণ করতে পারেন। অডিটর এখনও ন্যায্যতা নিরীক্ষণ টেবিল এবং প্রাসঙ্গিক ZKPs গ্রহণ করে। এটি ন্যায্যতা অডিটিং টেবিলটি ন্যায্যতা বোর্ডে সংরক্ষণ করতে পারে, ন্যায্যতা গণনা করতে পারে এবং ঘোষিত স্থানান্তর নম্বরগুলির সঠিকতা যাচাই করতে পারে। সর্বজনীন যাচাইকারী ন্যায্যতা অডিটিং টেবিলের মাধ্যমে ন্যায্যতা মেট্রিক গণনা যাচাই করতে একই পদক্ষেপগুলি অনুসরণ করতে পারে যা ফেয়ারনেস বোর্ডের মাধ্যমে সর্বজনীনভাবে অ্যাক্সেসযোগ্য।


এই পর্যায়ের শেষে, নিরীক্ষক ন্যায্যতা মেট্রিক গণনা করতে এবং তথ্য প্রকাশ্যে প্রকাশ করতে অর্জিত নম্বরগুলি ব্যবহার করে। প্রতিটি স্থানান্তরের সংখ্যা সুরক্ষিত বৈশিষ্ট্য সহ প্রতিটি গ্রুপের জন্য ML অ্যালগরিদমের সামগ্রিক কার্যকারিতা নির্দেশ করে। সারণি 4 পারমুটেশনগুলি প্রদর্শন করে এবং এটি কীভাবে এমএল সিস্টেমের ন্যায্যতা মেট্রিকের সাথে সম্পর্কিত। ক্রিপ্টোগ্রাম টেবিল এবং ফলাফল ফেয়ারনেস বোর্ডে প্রকাশ করা হবে (চিত্র 1)