লেখক:
(1) শাদাব আহমেদ, ইউনিভার্সিটি অফ ব্রিটিশ কলাম্বিয়া, ভ্যাঙ্কুভার, বিসি, কানাডা, বিসি ক্যান্সার রিসার্চ ইনস্টিটিউট, ভ্যাঙ্কুভার, বিসি, কানাডা। তিনি মাইক্রোসফ্ট এআই ফর গুড ল্যাব, রেডমন্ড, ডাব্লুএ, ইউএসএ (ই-মেইল: [email protected]) এর সাথে মিটাক্স এক্সিলারেট ফেলো (মে 2022 - এপ্রিল 2023) ছিলেন;
(2) Yixi Xu, Microsoft AI for Good Lab, Redmond, WA, USA;
(3) ক্লেয়ার গাউডি, বিসি চিলড্রেন হাসপাতাল, ভ্যাঙ্কুভার, বিসি, কানাডা;
(4) জু এইচ.ও, সেন্ট মেরি হাসপাতাল, সিউল, কোরিয়া প্রজাতন্ত্র;
(5) ইনগ্রিড ব্লোইস, বিসি ক্যান্সার, ভ্যাঙ্কুভার, বিসি, কানাডা;
(6) ডন উইলসন, বিসি ক্যান্সার, ভ্যাঙ্কুভার, বিসি, কানাডা;
(7) প্যাট্রিক মার্টিনো, বিসি ক্যান্সার, ভ্যাঙ্কুভার, বিসি, কানাডা;
(8) ফ্রাঙ্কোইস বেনার্ড, বিসি ক্যান্সার, ভ্যাঙ্কুভার, বিসি, কানাডা;
(9) ফেরেশতেহ ইউসেফিরিজি, বিসি ক্যান্সার রিসার্চ ইনস্টিটিউট, ভ্যাঙ্কুভার, বিসি, কানাডা;
(10) রাহুল দোধিয়া, Microsoft AI for Good Lab, Redmond, WA, USA;
(11) Juan M. Lavista, Microsoft AI for Good Lab, Redmond, WA, USA;
(12) William B. Weeks, Microsoft AI for Good Lab, Redmond, WA, USA;
(13) কার্লোস এফ. উরিবে, বিসি ক্যান্সার রিসার্চ ইনস্টিটিউট, ভ্যাঙ্কুভার, বিসি, কানাডা, এবং ইউনিভার্সিটি অফ ব্রিটিশ কলাম্বিয়া, ভ্যাঙ্কুভার, বিসি, কানাডা;
(14) আরমান রহমিম, বিসি ক্যান্সার রিসার্চ ইনস্টিটিউট, ভ্যাঙ্কুভার, বিসি, কানাডা, এবং ইউনিভার্সিটি অফ ব্রিটিশ কলাম্বিয়া, ভ্যাঙ্কুভার, বিসি, কানাডা।
অসংখ্য কাজ PET/CT চিত্রগুলিতে লিম্ফোমাকে ভাগ করার জন্য গভীর শিক্ষার পদ্ধতির প্রয়োগের অন্বেষণ করেছে। ইউয়ান এট আল। [৪] মাল্টি-মডালিটি ডেটা থেকে পরিপূরক তথ্য ব্যবহার করার জন্য একটি বৈশিষ্ট্য ফিউশন কৌশল তৈরি করেছে। হু এট আল। [৫] ভলিউম্যাট্রিক ডেটাতে প্রশিক্ষিত 3D ResUNet এবং তিনটি অর্থোগোনাল দিক থেকে বিভাজন কর্মক্ষমতা বাড়ানোর জন্য 2D স্লাইসে প্রশিক্ষিত তিনটি 2D ResUNet-এর সংমিশ্রণের প্রস্তাব করা হয়েছে। লি এট আল। [6] প্রস্তাবিত ডেনসএক্স-নেট লিম্ফোমা শনাক্তকরণ এবং বিভাজনের জন্য তত্ত্বাবধানে এবং তত্ত্বাবধানহীন পদ্ধতিগুলিকে একীভূত করে শেষ থেকে শেষ ফ্যাশনে প্রশিক্ষিত। লিউ এট আল। [৭] প্যাচ-ভিত্তিক নেতিবাচক নমুনা বৃদ্ধি এবং লিম্ফোমা সেগমেন্টেশনের জন্য একটি 3D রেসিডুয়াল-ইউনেট প্রশিক্ষণের জন্য লেবেল গাইডেন্সের মতো কৌশলগুলি চালু করেছে। এই সমস্ত কাজের একটি প্রধান সীমাবদ্ধতা ছিল যে সেগুলি তুলনামূলকভাবে ছোট আকারের ডেটাসেটে (100টিরও কম চিত্র) তৈরি করা হয়েছিল। অধিকন্তু, এই পদ্ধতিগুলির বেশিরভাগই তাদের প্রস্তাবিত পদ্ধতির কর্মক্ষমতাকে অন্যান্য বেসলাইনের সাথে বা চিকিত্সকদের কর্মক্ষমতার সাথে তুলনা করেনি।
কনস্টান্টিনো এট আল। [৮] 7টি আধা-স্বয়ংক্রিয় এবং 2টি গভীর শিক্ষা বিভাজন পদ্ধতির পারফরম্যান্সের তুলনা করে, যখন ওয়েইসম্যান এট আল। [৯] 11টি স্বয়ংক্রিয় বিভাজন কৌশলের তুলনা করা হয়েছে, যদিও এই উভয় অধ্যয়ন যথাক্রমে 65 এবং 90 আকারের ছোট ডেটাসেটে সঞ্চালিত হয়েছিল। উইজম্যান এট আল। [১০] স্বয়ংক্রিয় 3D ডিপ মেডিক পদ্ধতির সেগমেন্টেশন পারফরম্যান্সকে চিকিত্সকের সাথে তুলনা করে যদিও এই গবেষণায় মাত্র 90টি লিম্ফোমা কেস অন্তর্ভুক্ত ছিল। [১০] ব্যতীত, এই সমীক্ষাগুলির মধ্যে কোনটিই তাদের দৃঢ়তার পরিমাণ এবং বাহ্যিক বৈধতা সীমিত করে বহির্বিভাগের ডেটাসেটের (যেমন বিভিন্ন কেন্দ্র থেকে সংগৃহীত ডেটার উপর) মডেল সাধারণীকরণের প্রতিবেদন করেনি। জিয়াং এট আল। [১১] একটি 3D UNet প্রশিক্ষণের জন্য 297টি চিত্র সহ উপরের গবেষণার তুলনায় তুলনামূলকভাবে বড় ডেটাসেট ব্যবহার করেছে। এমনকি তারা একটি ভিন্ন কেন্দ্র থেকে সংগৃহীত 117টি চিত্রের উপর বিতরণের বাইরে পরীক্ষাও করেছে। আমাদের সর্বোত্তম জ্ঞান অনুসারে, গভীর শিক্ষা-ভিত্তিক ক্ষত বিভাজনের জন্য সবচেয়ে বড় লিম্ফোমা PET/CT ডেটাসেটটি ব্ল্যাঙ্ক-ডুরান্ড এট আল-এর কাজ। [১২] যিনি মডেল ডেভেলপমেন্টের জন্য ৬৩৯টি ছবি এবং বাহ্যিক পরীক্ষার জন্য ৯৪টি ছবি ব্যবহার করেছেন; যাইহোক, এই গবেষণায় শুধুমাত্র স্ট্যান্ডার্ড সেগমেন্টেশন মূল্যায়ন মেট্রিক্স ব্যবহার করা হয়েছে এবং সঠিক TMTV ভবিষ্যদ্বাণী করার জন্য তাদের মডেলের ক্ষমতা মূল্যায়ন করা হয়েছে। উভয় অধ্যয়ন [১১] এবং [১২] এই সত্য দ্বারা সীমাবদ্ধ যে তাদের ডেটাসেটগুলি একচেটিয়াভাবে ডিফিউজ লার্জ বি-সেল লিম্ফোমা (ডিএলবিসিএল) নির্ণয় করা রোগীদের নিয়ে গঠিত, যা লিম্ফোমার একটি একক উপপ্রকার প্রতিনিধিত্ব করে।
ডিপ লার্নিং-ভিত্তিক লিম্ফোমা সেগমেন্টেশনের উপর বিদ্যমান বেশিরভাগ গবেষণাগুলি জেনেরিক সেগমেন্টেশন মেট্রিক্স যেমন ডাইস সাদৃশ্য সহগ (DSC), ইন্টারসেকশন-ওভার-ইউনিয়ন (IoU), সংবেদনশীলতা, ইত্যাদির উপর তাদের পারফরম্যান্সের প্রতিবেদন করে। বড় সেগমেন্টেড ক্ষতগুলির উপস্থিতিতে, খুব ছোট মিসড ক্ষত বা ছোট মিথ্যা ইতিবাচক DSC মানতে খুব বেশি অবদান রাখে না। অতএব, মিথ্যা ইতিবাচক এবং মিথ্যা নেতিবাচক ভলিউম রিপোর্ট করার প্রয়োজন আছে। প্রতি-ক্ষত ভিত্তিতে সনাক্তকরণ কার্যক্ষমতা মূল্যায়ন করাও উপকারী হবে (সংযুক্ত উপাদানের সংখ্যা শনাক্ত করা বনাম মিস করা হয়েছে), যেহেতু সমস্ত ক্ষতের এমনকি কয়েকটি ভক্সেলের স্বয়ংক্রিয় সনাক্তকরণ চিকিত্সকদের দ্রুত আগ্রহের অঞ্চলগুলি সনাক্ত করতে সহায়তা করতে পারে, এমনকি যদি ডিএসসি কম। অধিকন্তু, বিভাজন/শনাক্তকরণ কাজের অসুবিধা প্রায়ই আন্তঃ- বা আন্তঃ-পর্যবেক্ষক চুক্তি বিশ্লেষণের মাধ্যমে মূল্যায়ন করা হয় না।
আমাদের অধ্যয়নের লক্ষ্য এই সীমাবদ্ধতাগুলিকে মোকাবেলা করা। আমরা লিম্ফোমা পিইটি/সিটি ডেটাসেটের চারটি গভীর নিউরাল নেটওয়ার্ককে প্রশিক্ষিত এবং যাচাই করেছি, লিম্ফোমার দুটি স্বতন্ত্র উপপ্রকার অন্তর্ভুক্ত করে: ডিএলবিসিএল এবং প্রাথমিক মিডিয়াস্টিনাল লার্জ বি-সেল লিম্ফোমা (পিএমবিসিএল)। (i) আমরা আমাদের মডেলের দৃঢ়তা মূল্যায়ন করার জন্য (প্রশিক্ষণ/বৈধকরণ সেটের মতো একই দল থেকে আসা ছবি) এবং বিতরণের বাইরে বা বহিরাগত (প্রশিক্ষণ/বৈধকরণের জন্য ব্যবহৃত নয় এমন একটি চতুর্থ দল থেকে আসা ছবি) উভয় ক্ষেত্রেই পারফর্ম করেছি। (ii) আমরা ডিএসসি, মিথ্যা ইতিবাচক এবং নেতিবাচক ভলিউম ব্যবহার করে পারফরম্যান্স রিপোর্ট করেছি এবং ছয়টি বিভিন্ন ধরণের ক্ষত পরিমাপের উপর কর্মক্ষমতা নির্ভরতা মূল্যায়ন করেছি। (iii) আমরা আমাদের নেটওয়ার্কগুলির এই গ্রাউন্ড ট্রুথ ক্ষত পরিমাপগুলি পুনরুত্পাদন করার ক্ষমতা এবং তাদের পূর্বাভাস দেওয়ার ক্ষেত্রে গণনা করা নেটওয়ার্কগুলির ত্রুটির মূল্যায়ন করেছি৷ (iv) আমরা আমাদের ব্যবহারের ক্ষেত্রে তিন ধরনের সনাক্তকরণের মানদণ্ড প্রস্তাব করেছি এবং এই মেট্রিক্সে মডেলের কর্মক্ষমতা মূল্যায়ন করি। (v) অবশেষে, আমরা আমাদের ডেটাসেটে ক্ষত বিভাজন কাজের অসুবিধার একটি পরিমাপ দিতে আন্তঃ- এবং আন্তঃ-পর্যবেক্ষক চুক্তির মূল্যায়ন করেছি।
এই কাগজটি CC 4.0 লাইসেন্সের অধীনে arxiv-এ উপলব্ধ ।