طریقے
اس منصفانہ تصور کو عملی جامہ پہنانے اور روایتی گروپ کی انصاف پسندی کے ساتھ فرق ظاہر کرنے کے لیے، ہم تین ماڈلز کا موازنہ کرتے ہیں جو ایک بنیادی ماڈل سے حساس صفات کا استعمال کرتے ہیں۔ ماڈل کے ذریعہ جس طرح سے حساس صفات کا استعمال کیا جاتا ہے اس کا ماڈل کی منصفانہ اور کارکردگی پر اثر پڑتا ہے [3,39,41,11]۔ لہذا، ہم ایسے ماڈلز کا استعمال کرتے ہیں جن میں واضح طور پر حساس صفات شامل ہوں، یا اس کے برعکس، ان پٹ ڈیٹا سے کسی بھی ڈیموگرافک انکوڈنگ کو ہٹا دیں۔
چاروں ماڈلز کو سینے کی ریڈیوگرافی (CXR) میں نتائج کے ملٹی لیبل درجہ بندی کے مسئلے پر تربیت دی جاتی ہے۔ تمام ترتیبات میں، Densenet-121 [13] بیک بون استعمال کیا جاتا ہے، جو تجرباتی طور پر اس مسئلے کے لیے بہترین کارکردگی دینے کے لیے پرعزم تھا۔ عین مطابق ماڈل کے فن تعمیر کو شکل 2 میں دکھایا گیا ہے اور ذیل میں بیان کیا گیا ہے:
– M1 : ایک بنیادی درجہ بندی کرنے والا جو امیجز کو بطور ان پٹ استعمال کرتا ہے اور ہمارے ڈیٹاسیٹ سے وابستہ ہدف شدہ CXR نتائج کی پیش گوئی کرنے کے لیے تربیت یافتہ ہے۔ ماڈل میں تصویر کی خصوصیات کو نکالنے کے لیے ایک ریڑھ کی ہڈی اور ایک فائنڈنگ برانچ پر مشتمل ہے جس میں مکمل طور پر جڑی ہوئی پرت اور ہر تلاش کے لیے بائنری کراس اینٹروپی نقصان شامل ہے۔
– M2 : ایک درجہ بندی کرنے والا جو تصاویر اور ریس کی خصوصیات دونوں کو بطور ان پٹ استعمال کرتا ہے۔ ریس کی معلومات ایک واضح متغیر کی شکل میں آتی ہے، جسے ہم ایک گرم ویکٹر میں تبدیل کرتے ہیں اور مکمل طور پر منسلک پرت میں فیڈ کرتے ہیں۔ ہم برانچ تلاش کرنے کے لیے آگے بھیجنے سے پہلے مکمل طور پر منسلک پرت سے خصوصیات اور تصویری خصوصیات کو جوڑتے ہیں۔ ماڈل آخر سے آخر تک تربیت یافتہ ہے۔
– M3 : ایک درجہ بندی کرنے والا جو تصاویر کو صرف ان پٹ کے طور پر استعمال کرتا ہے، لیکن تصویری نتائج کے ساتھ ساتھ ریس گروپ کی پیشین گوئی کرنے کے لیے تربیت یافتہ ہے (یعنی اس ماڈل کا مقصد تصاویر میں موجود ریس انکوڈنگز کا فائدہ اٹھانا ہے)۔ اس ماڈل کے لیے، ہم دو کاموں کو بہتر بنانے کے لیے نقصان کے فنکشن کو ڈھال کر بیس لائن کلاسیفائر کی آخری پرت میں ترمیم کرتے ہیں: CXR فائنڈنگز اور ریس گروپ۔ ہم کثیر طبقے کے نقصان کو لاگو کرنے کے لیے ریس کی معلومات کو ایک گرم انکوڈ شدہ ویکٹر میں بھی تبدیل کرتے ہیں۔ ریس کی درجہ بندی کی شاخ مکمل طور پر منسلک پرت اور کراس اینٹروپی نقصان کے فنکشن سے بنی ہے۔ حتمی نقصان کا حساب کھوجنے والے نقصان اور دوڑ کے نقصان کو کم وزن کے ساتھ شامل کرکے لگایا جاتا ہے۔
– M4 : تصویروں کو بطور ان پٹ استعمال کرنے والا ایک درجہ بندی کرنے والا، تصویری نتائج کی پیشین گوئی کرنے کے لیے تربیت یافتہ، جبکہ تصویر میں انکوڈ شدہ نسل کی معلومات کے استعمال کو کم سے کم کرتا ہے۔ اس ماڈل کے لیے، ہم [28] میں بیان کردہ تدریجی تبدیلی کی تکنیک کو نافذ کرتے ہیں۔ ہم ریس برانچ سے پہلے گریڈینٹ ریورسل پرت کا اطلاق کرتے ہیں۔
مصنفین:
(1) Samia Belhadj∗, Lunit Inc., Seoul, Republic of Korea ([email protected])؛
(2) سنگوک پارک [0009 −0005 −0538 −5522]*, Lunit Inc., Seoul, Republic of Korea ([email protected])؛
(3) امبیکا سیٹھ، لونٹ انکارپوریٹڈ، سیول، جمہوریہ کوریا ([email protected])؛
(4) ہشام ڈار [0009 −0003 −6458 −2097], Lunit Inc., Seoul, Republic of Korea ([email protected])؛
(5) Thijs Kooi [0009 −0003 −6458 −2097], Kooi, Lunit Inc., Seoul, Republic of Korea ([email protected])۔
یہ کاغذ CC BY-NC-SA 4.0 لائسنس کے تحت arxiv پر دستیاب ہے۔