صحت اور مالیاتی خدمات کے طور پر منظم ڈومینز میں، ڈیٹا اداروں کو چھوڑ نہیں سکتا، لیکن ماڈلوں کو توسیع شدہ، انتہائی غلطی سے ٹیبلڈ ڈیٹا سیٹ سے سیکھنے کی ضرورت ہے. ایک پراگیمٹک فریدڈ انٹرفیس تین حرکت کے حصوں پر مشتمل ہے: ایک کنٹرولر (آکٹسٹریٹ راؤنڈز، ٹریک میٹا ڈیٹا، پالیسی کو نافذ کرتا ہے)، بہت سے گاہکوں (ایکٹسٹریٹ، بینک، فلیٹ، لیب) جو مقامی طور پر اپ ڈیٹ کو کمپیوٹر کرنے کے لئے کام کرتے ہیں، اور ایک مجموعیٹر (ایکٹوریٹر کے ساتھ اکثر مشترکہ طور پر واقع ہوتا ہے) جو عالمی ماڈل پیدا کرتا ہے. مواصلات سائن انٹرفیس میں چلتا ہے: کنٹرولر ایک کلائنٹ خطرے کے ماڈل کو ایک لائن کوڈ کشتیوں سے پہلے واضح ہونا چاہئے. aggregator: سرور پروٹوکول کی پیروی کرتا ہے لیکن اپ ڈیٹ سے کلائنٹ ڈیٹا حاصل کرنے کی کوشش کر سکتا ہے. (مچھلی) اور مصنوعی اپ ڈیٹ بھیجیں کہ ماڈل کو زہریلا کریں یا ورڈینٹ جراحی کے ذریعے دوسروں کے اعداد و شمار کو چوری کریں. بیرونی مخالفین کو جاری شدہ ماڈل سے رکنیت کے اختتام یا دوبارہ تعمیر کرنے کی کوشش کرسکتے ہیں. کلائنٹ کی طرف سے، ڈیٹا کی آمدنی مختلف ہوتی ہے-کوڈنگ سسٹمز (ICD، CPT)، واقعات کے ٹائمٹیمپ، ناکامی کے نمونے-اور یہ heterogeneities کے کنارے کے چینلز بن جاتے ہیں اگر معیاری نہیں ہوتے ہیں. پالیسی کے فیصلے ماڈل سے جاری ہوتے ہیں: اگر مجموعیٹر کو صرف منظم کرنے کے لئے اعتماد کیا جاتا ہے لیکن انفرادی اپ ڈیٹس کو دیکھنے کے لئے نہیں ہے تو، آپ کو محفوظ مجموعہ کی ضرورت ہوگی، اگر اندرونی خطرات زبردست لیکن دلچسپ Byzantine کے XGBoost اور TabNet کے لئے فدرولڈ پائپ لائنز درخت مجموعات اور نیورل ٹیبلر ماڈل مختلف طریقے سے اتحاد کرتے ہیں، لیکن دونوں کو صحیح اختلاطات کے ساتھ عملی بنا سکتے ہیں. کے لئے بنیادی سوالات ڈیٹا پارٹیشننگ اور تقسیم اعداد و شمار کو چھپانے کے لئے کس طرح ہیں. فنڈنگ (ہر کلائنٹ کو ایک ہی خصوصیات کے ساتھ مختلف لائنوں کا مالک ہے)، کلائنٹ اپنے ٹریڈز کے لئے مقامی طور پر گریڈینٹ / ہیسیان ہسٹograms کو شمار کرتے ہیں؛ مجموعہ کار ہسٹograms کو جمع کرتا ہے اور عالمی طور پر تقسیمات کا انتخاب کرتا ہے. فریدی (ہر کلائنٹ کو اسی افراد کے لئے مختلف خصوصیات ملتی ہیں)، پارٹیوں کو مشترکہ طور پر مشترکہ اعداد و شمار کے ذریعہ پرائیویسی کو برقرار رکھنے کے پروٹوکولز کے ذریعے مشترکہ فریدی کے اعداد و شمار کا حساب کرتے ہیں، زیادہ پیچیدہ اور اکثر محفوظ انکلوپ یا خفیہ ابتدائیوں کی ضرورت ہوتی ہے. فریدی کو فریدی کرنے کے لئے، پہلے سے تربیت یافتہ مجموعہ سے شروع کریں (مثال کے طور پر، ایک مطابقت پذیر sandbox میں یا مصنوعی ڈیٹا پر تربیت یافتہ). ہر دور میں، کسٹمرز کو چھوٹی سی تعداد میں درخت شامل کرنے کی اجازت دیتا ہے یا مقامی گریڈینٹز کا استعمال کرتے ہوئے لکڑی کے وزن کو منظم کرنے کی اجازت دیتا ہے. گہرائی، شرح سیکھنے اور ہر دور میں اضافی درختوں کی تعداد کو XGBoost, horizontal کے vertical کے کے لئے (یا اسی طرح کے نیورل ٹیبلر آرکیٹیکلز)، کلاسیکی کام کرتے ہیں: وزن تقسیم کریں، تھوڑی دیر کے لئے مقامی طور پر تربیت کریں، اس کے بعد ابتدائی روک تھام کے ساتھ، اوسط. TabNet کے سلسلے میں توجہ اور کمی کے منظم کرنے والے سیکھنے کی شرح کی منصوبوں کے لئے حساس ہیں؛ مرکزی بنیادی لائنوں کے مقابلے میں کم کلائنٹ LR کا استعمال کرتے ہوئے، سرور کی طرف سے بہتر بنانے والے (فیدادام یا فیڈیوجی) کو مختلف سائٹس پر مستحکم کرنے کے لئے استعمال کرتے ہیں، اور پہلی دوروں کے دوران اعلی کارڈینالٹی کی قسم کی خصوصیات کے لئے انبساطات کو منجمد کرتے ہیں تاکہ انبساطات کو کم کرنے کے لئے انبساطات کو کم کرنے کے لئے. مخلوط درستگی محفوظ ہے اگر تمام کلائنٹ ڈیٹینسٹک کنڈرولز استعمال کرتے ہیں؛ دوسری صورت میں، پلانٹنگ پوائن TabNet فٹنگ دو نظام کے اختیارات کارکردگی کو بہتر بنانے. سب سے پہلے، شامل کریں کسٹمرز (FedProx) کو مقامی اقدامات کو عالمی وزن سے بہت دور دور جانے سے روکنے کے لئے؛ یہ غیر IID خصوصیات کی تقسیم سے نقصان کو کم کرتا ہے. یا عالمی ماڈل سے خصوصیات کی اہمیت کا خلاصہ گاہکوں کو مقامی طور پر غیر مفید کالموں کو کاٹنے، I / O کاٹنے اور حملے کی سطح پر واپس. دونوں پائپ لائنز میں، ماڈل کی حالت اور آپریٹر کے اوقات کی سیریزنگ کا یونٹ ٹیسٹ کریں تاکہ اپ گریڈز ایک روکنے والی فریمنگ کی واپسی کو غیر فعال نہ کریں. proximal regularization کے مترادفات ماسک منتخب کریں Federated Averaging vs. Secure Aggregation vs. Differential پرائیویسی فیڈرڈ ماڈلنگ (FedAvg) صرف اعداد و شمار کی پوزیشن کی حفاظت کرتا ہے لیکن انفرادی اپ ڈیٹس کو چھپانے نہیں دیتا. اگر آپ کا مجموعہ کار عادل لیکن عجیب ہے تو، محفوظ مجموعہ بنیادی طور پر ہے: کلائنٹ ان کی اپ ڈیٹس کو جوڑوں کے ساتھ ایک بار پڈوں (یا اضافی طور پر ہیومومرومفک کوڈنگ کے ذریعے) کے ساتھ چھپاتے ہیں، لہذا سرور صرف ان کی معلومات سیکھتا ہے. اپ ڈیٹس کے جب ایک گنجائش گاہکوں میں حصہ لیتا ہے. یہ منسلک کرنے سے روکتا ہے کسی بھی ہسپتال کے گائیڈینٹ ہسٹامگ یا وزن ڈیلٹ کی جانچ پڑتال. ٹرانسمیشن انجینئرنگ اور زندگی ہے: آپ کو droppout-resilient پروٹوکولز کی ضرورت ہے، دیر سے کلائنٹ ہینڈلنگ، اور ماسک کی بحالی کے طریقوں؛ گھڑیوں کو روک سکتا ہے اگر بہت سے گاہکوں ناکام ہوتے ہیں، لہذا اپ ڈیٹنگ کی گائیڈز اور جزوی ہینڈلنگ کو صرف جب یہ کسی بھی شرکاء کو deanonymize نہیں کرسکتے ہیں. XGBoost ہسٹامگ کے لئے، محفوظ مجموعہ اچھی طرح کام کرتا ہے کیونکہ اضافی اہم عمل ہے؛ نیٹ ٹیب کے لئے، وزن ٹینس sum کے یہ ایک مختلف خطرہ کا حل ہے: ایک حملہ آور نے شائع کردہ عالمی ماڈل سے کیا منسوخ کر سکتے ہیں. ، آپ سرور پر مجموعی اپ ڈیٹ (post-secure aggregation) میں kalibrated noise شامل کرتے ہیں، اور ایک moment accountant کا استعمال کرتے ہوئے ہر دور میں ایک پرائیویسی بیج ((\varepsilon, \delta)) کی پیروی کرتے ہیں. ، ہر کلائنٹ محفوظ جمع کرنے سے پہلے اپنے اپ ڈیٹ کو روکتا ہے؛ یہ زیادہ طاقتور ہے لیکن عام طور پر ٹیبلر کاموں پر زیادہ فائدہ اٹھاتا ہے. ہسپتال / فینٹچ کے استعمال کے لئے، کلپنگ کے ساتھ مرکزی ڈی پی (per-client update norm bound) پلس محفوظ جمع کرنے کے لئے شیرین نقطہ ہے: سرور کبھی خام اپ ڈیٹ نہیں دیکھتا ہے، اور عوامی ماڈل ایک معیار کی ضمانت رکھتا ہے. کلپ کے معیار، ہلکے کثیر، اور کلائنٹ فریکشن فی دور کے ساتھ تین ڈائیلوں کو ایک دوسرے کے ساتھ توازن کرنے کے لئے توقع کریں. XGBoost کے لئے، ڈی پی ہسٹوگرام کے شماروں پر لاگو کیا جا سکتا ہے (بچوں کی رقموں اور آمدنیوں کو ہلکے شامل کرنے کے لئے) Differential privacy (DP) مرکزی DP مقامی DP مختصر طور پر: FedAvg مقامی طور پر ضروری ہے، اپ ڈیٹ کی رازداری کے لئے محفوظ مجموعہ ضروری ہے، اور ڈی پی ریلیز کے وقت کی ضمانتوں کے لئے ضروری ہے. بہت سے منظم اپلی کیشنز تمام تینوں کا استعمال کرتے ہیں: FedAvg آرکسٹریشن کے لئے، نقل و حمل کے وقت کی رازداری کے لئے محفوظ مجموعہ، اور ماڈل کی سطح کی رازداری کے لئے مرکزی ڈی پی. کیا نگرانی کرنے کے لئے: ڈرائیو، حصہ لینے کی منحصر، اور ایڈریس ٹریکز نگرانی ایک مطابقت پذیر ڈیمو اور ایک محفوظ، مفید نظام کے درمیان فرق کرتا ہے. ڈیٹا اور خیالات کے ڈرائیو کے ساتھ شروع کریں. کلائنٹ کی طرف سے، ہلکے، پرائیویسی کی حفاظت کرنے والے اسکائٹس کو کمپیوٹ کریں — خصوصیات کے ذریعہ اور متغیر، قسم کی فریکوئنسی ہاؤسز، PSI / Wasserstein کی تصدیق کردہ مجموعی اعداد و شمار کے بارے میں محفوظ، اور صرف مجموعی یا DP-روغی کے خلاصے کو منظم کرنے کے لئے رپورٹ کریں. سرور پر، ایک مقررہ، پالیسی کی منظوری کے مطابق ڈیٹا سیٹ پر عالمی تصدیق میٹرک کی پیروی کریں؛ مصنوعی مجموعیوں کی طرف سے تقسیم میٹرک جو جانا جاتا ہے heterogeneity (ایک عمر کے گروپ، خطرے کے بینڈ، آلہ اگر صرف بڑے شہروں کے ہسپتالوں یا اعلی اثاثہ فیکٹریوں کو مسلسل آن لائن آتا ہے تو، عالمی ماڈل ان آبادیوں کے لئے مناسب ہو جائے گا. ریکارڈ، کنورٹر پر، فعال گاہکوں کی تقسیم فی دورہ، معیار کی نمونہ سائز کے مطابق وزن، اور فی کلائنٹ (یا علاقے کے مطابق) حصہ لینے کی شرح کے ساتھ انصاف ڈسپلے رکھیں. مستقبل کے دوروں میں اصلاحی نمونہ کا استعمال کریں - مسلسل کم نمائندگی کرنے والے گاہکوں کا مجموعہ کریں - اور، اگر ممکن ہو تو، محفوظ مجموعہ کے تحت معیار ڈیٹا حجم کے ساتھ اپ ڈیٹ کو دوبارہ وزن کریں (موازنہ بیکوں کے مقابلے میں درست شماروں کا اشتراک کریں). انتہائی متنازعہ کاموں کے لئے، زیادہ سے زیادہ علاقائی یا کسٹمر مخصوص ماڈلوں اور ایک Participation bias ہر دور کو ایک دستخط ریکارڈ پیدا کرنا چاہئے جس میں ماڈل ورژن، کلائنٹ اختیارات سیٹ (پیسڈونیم IDs)، پروٹوکول ورژن، محفوظ جمع کے پیرامیٹرز، ڈی پی اکاؤنٹنگ کی حالت (\varepsilon، \delta))، کلپ کی حدیں، اور مجموعی نگرانی اسکینز شامل ہیں. ماڈل چیک پوائنٹس کے ہچز کو اسٹوریج کریں اور ان کو کلپ کے میٹا ڈیٹا سے منسلک کریں تاکہ آپ صحیح تربیت کے راستے کو دوبارہ تعمیر کرسکتے ہیں. ریگولیٹر کا جائزہ لینے کے لئے ایک tamper-evident پروگرامنگ کو برقرار رکھیں. واقعات کے جواب کے لئے، غیر متبادلوں کو توڑنے کے وقت خود کار طریقے سے بند کریں: کلائنٹ کے انتخاب میں نمون Audit trails آخر میں، ماڈل اپ ڈیٹ کریں ڈیفالٹ ریلیز چینلز کو یقینی بنائیں: اندرونی ماڈلوں کو ڈی پی ریموٹ کو ہیک کر سکتے ہیں اگر وہ آکلوڈ سے کبھی نہیں نکلتے ہیں، جبکہ بیرونی مشترکہ ماڈلوں کو ڈی پی اکاؤنٹنگ کی ضرورت ہوتی ہے. شیڈم میں تبدیلیوں اور خصوصیات میں اضافے کے لئے انسانی منظوری کی ضرورت ہوتی ہے؛ ٹیبلر ڈومینز میں، ایک "ایک سے زیادہ کالم" عادت یہ ہے کہ رازداری کی چوری کیسے ہوتی ہے. کسٹمروں کو ایک خشک چلانے کا طریقہ فراہم کریں جو شیڈمز کی تصدیق کرتا ہے، اسکینز کا حساب کرتا ہے، اور اپ ڈیٹ کرنے کے بغیر کمپیوٹنگ کی لاگت کا اندازہ کرتا ہے-یہ ناکام دوروں کو کم کرتا ہے اور سکون ڈیٹا کے مسائل سے بچاتا ہے. اور خطر ڈیفالٹ سے محفوظ لے جاؤ ہسپتالوں اور فینٹیچ میں ٹیبلڈر ڈیٹا کے لئے، عملی طور پر layering دفاعات سے آتا ہے. لائنوں کو ٹھیک رکھنے کے لئے فینڈرڈ ماڈلنگ کا استعمال کریں، کسی بھی سائٹس کی فہرست کو چھپانے کے لئے محفوظ مجموعہ، اور انفرادی پرائیویسی جو آخری ماڈل چوری کرسکتا ہے کو منسلک کرنے کے لئے. ٹیبلڈر خصوصیات کا احترام کرنے والے پائپ لائنوں میں ان اختیارات کو پکڑیں - XGBoost کے لئے ہسٹوگرام اشتراک، ٹیبلٹ کے لئے مستحکمین - اور نظام کو ڈرائیو اور سوئچ کرنے کے لئے ایک ہاک کی طرح دیکھیں. ایسا کریں، اور آپ ڈیٹا کو کسی بھی طے کے ذریعے گزرنے کے بغیر اداروں کے درمیان ماڈل کو اچھی طرح سے ترتیب دے سکتے ہیں، جبکہ