paint-brush
ডিপ নিউরাল নেটওয়ার্ক লিম্ফোমা ক্ষত সনাক্ত এবং পরিমাপ করার জন্য: উপাদান এবং পদ্ধতিদ্বারা@reinforcement
102 পড়া

ডিপ নিউরাল নেটওয়ার্ক লিম্ফোমা ক্ষত সনাক্ত এবং পরিমাপ করার জন্য: উপাদান এবং পদ্ধতি

দ্বারা Reinforcement Technology Advancements7m2024/06/12
Read on Terminal Reader

অতিদীর্ঘ; পড়তে

এই গবেষণাটি পিইটি/সিটি ছবি থেকে লিম্ফোমা ক্ষত বিভাজনের জন্য চারটি নিউরাল নেটওয়ার্ক আর্কিটেকচারের ব্যাপক মূল্যায়ন করে।
featured image - ডিপ নিউরাল নেটওয়ার্ক লিম্ফোমা ক্ষত সনাক্ত এবং পরিমাপ করার জন্য: উপাদান এবং পদ্ধতি
Reinforcement Technology Advancements HackerNoon profile picture
0-item

লেখক:

(1) শাদাব আহমেদ, ইউনিভার্সিটি অফ ব্রিটিশ কলাম্বিয়া, ভ্যাঙ্কুভার, বিসি, কানাডা, বিসি ক্যান্সার রিসার্চ ইনস্টিটিউট, ভ্যাঙ্কুভার, বিসি, কানাডা। তিনি Microsoft AI for Good Lab, Redmond, WA, USA-এর একজন Mitacs Accelerate Fellow (মে 2022 - এপ্রিল 2023) ছিলেন (ই-মেইল: [email protected]);

(2) Yixi Xu, Microsoft AI for Good Lab, Redmond, WA, USA;

(3) ক্লেয়ার গাউডি, বিসি চিলড্রেন হাসপাতাল, ভ্যাঙ্কুভার, বিসি, কানাডা;

(4) জু এইচ.ও, সেন্ট মেরি হাসপাতাল, সিউল, কোরিয়া প্রজাতন্ত্র;

(5) ইনগ্রিড ব্লোইস, বিসি ক্যান্সার, ভ্যাঙ্কুভার, বিসি, কানাডা;

(6) ডন উইলসন, বিসি ক্যান্সার, ভ্যাঙ্কুভার, বিসি, কানাডা;

(7) প্যাট্রিক মার্টিনো, বিসি ক্যান্সার, ভ্যাঙ্কুভার, বিসি, কানাডা;

(8) ফ্রাঙ্কোইস বেনার্ড, বিসি ক্যান্সার, ভ্যাঙ্কুভার, বিসি, কানাডা;

(9) ফেরেশতেহ ইউসেফিরিজি, বিসি ক্যান্সার রিসার্চ ইনস্টিটিউট, ভ্যাঙ্কুভার, বিসি, কানাডা;

(10) রাহুল দোধিয়া, Microsoft AI for Good Lab, Redmond, WA, USA;

(11) Juan M. Lavista, Microsoft AI for Good Lab, Redmond, WA, USA;

(12) William B. Weeks, Microsoft AI for Good Lab, Redmond, WA, USA;

(13) কার্লোস এফ. উরিবে, বিসি ক্যান্সার রিসার্চ ইনস্টিটিউট, ভ্যাঙ্কুভার, বিসি, কানাডা, এবং ইউনিভার্সিটি অফ ব্রিটিশ কলাম্বিয়া, ভ্যাঙ্কুভার, বিসি, কানাডা;

(14) আরমান রহমিম, বিসি ক্যান্সার রিসার্চ ইনস্টিটিউট, ভ্যাঙ্কুভার, বিসি, কানাডা, এবং ইউনিভার্সিটি অফ ব্রিটিশ কলাম্বিয়া, ভ্যাঙ্কুভার, বিসি, কানাডা।

লিঙ্কের টেবিল

উপসংহার এবং রেফারেন্স
III. উপকরণ এবং পদ্ধতিসমূহ

উ: ডেটাসেট


1) বর্ণনা: এই কাজে, আমরা মোট 611 টি কেস সহ একটি বৃহৎ, বৈচিত্র্যময় এবং বহু-প্রাতিষ্ঠানিক সমগ্র-শরীরের PET/CT ডেটাসেট ব্যবহার করেছি। এই স্ক্যানগুলি চারটি পূর্ববর্তী দল থেকে এসেছে: (i) ডিএলবিসিএল-বিসিসিভি: BC ক্যান্সার, ভ্যাঙ্কুভার (বিসিসিভি), কানাডা থেকে ডিএলবিসিএল-এর 79 জন রোগীর কাছ থেকে 107টি স্ক্যান করা হয়েছে; (ii) PMBCLBCCV: BC ক্যান্সার থেকে PMBCL আক্রান্ত 69 জন রোগীর 139টি স্ক্যান; (iii) DLBCL-SMHS: সেন্ট মেরি'স হাসপাতাল, সিউল (SMHS), দক্ষিণ কোরিয়া থেকে DLBCL-এর 219 জন রোগীর 220টি স্ক্যান; (iv) AutoPET লিম্ফোমা: ইউনিভার্সিটি হসপিটাল Tubingen, জার্মানি থেকে 144 জন লিম্ফোমা রোগীর থেকে 145টি স্ক্যান ¨ [14]। স্ক্যানের সংখ্যা, রোগীর বয়স এবং লিঙ্গের অতিরিক্ত বিবরণ এবং প্রতিটি দলের জন্য পিইটি/সিটি স্ক্যানার নির্মাতারা সারণি I-তে দেওয়া হয়েছে। দলগুলি (i)-(iii) সমষ্টিগতভাবে অভ্যন্তরীণ দল হিসাবে উল্লেখ করা হয়েছে। সমগোত্রীয়দের জন্য (i) এবং (ii), যথাক্রমে 30 অক্টোবর 2019 এবং 1 আগস্ট 2019 তারিখে UBC BC ক্যান্সার রিসার্চ এথিক্স বোর্ড (REB) (REB নম্বর: H19-01866 এবং H19-01611) দ্বারা নৈতিকতার অনুমোদন দেওয়া হয়েছিল। কোহর্টের জন্য (iii), সেন্ট মেরি'স হাসপাতাল, সিউল (REB নম্বর: KC11EISI0293) 2 মে 2011-এ অনুমোদন দেওয়া হয়েছিল।


চারটি ভিন্ন লিম্ফোমা কোহর্ট জুড়ে টেবিল আইপিয়েন্ট এবং স্ক্যান বৈশিষ্ট্য।


আমাদের ডেটার পূর্ববর্তী প্রকৃতির জন্য, এই তিনটি দলগুলির জন্য রোগীর সম্মতি মওকুফ করা হয়েছিল। কোহর্ট (iv) সর্বজনীনভাবে উপলব্ধ AutoPET চ্যালেঞ্জ ডেটাসেট থেকে প্রাপ্ত হয়েছিল [14] এবং বহিরাগত দল হিসাবে উল্লেখ করা হয়।


2) গ্রাউন্ড ট্রুথ টীকা: ডিএলবিসিএল-বিসিসিভি, পিএমবিসিএলবিসিসিভি, এবং ডিএলবিসিএল-এসএমএইচএস দলগুলিকে বিসি ক্যানসার, ভ্যানকোভার থেকে তিনজন নিউক্লিয়ার মেডিসিন চিকিত্সক (যথাক্রমে চিকিত্সক 1, চিকিত্সক 4 এবং চিকিত্সক 5 হিসাবে উল্লেখ করা হয়েছে) দ্বারা বিভক্ত করা হয়েছিল। যথাক্রমে হাসপাতাল, ভ্যাঙ্কুভার এবং সেন্ট মেরি'স হাসপাতাল, সিউল। অতিরিক্তভাবে, বিসি ক্যান্সারের আরও দুইজন নিউক্লিয়ার মেডিসিন চিকিত্সক (চিকিৎসক 2 এবং 3) ডিএলবিসিএল-বিসিসিভি দল থেকে 9 টি কেস ভাগ করেছেন যা আন্তঃ-পর্যবেক্ষক পরিবর্তনশীলতা (বিভাগ IV-ডি) মূল্যায়নের জন্য ব্যবহৃত হয়েছিল। চিকিত্সক 4 অতিরিক্তভাবে পিএমবিসিএল-বিসিসিভি দল থেকে 60 টি কেস পুনরায় ভাগ করেছেন যা আন্তঃ-পর্যবেক্ষক পরিবর্তনশীলতা (বিভাগ IV-সি) মূল্যায়নের জন্য ব্যবহৃত হয়েছিল। এই সমস্ত বিশেষজ্ঞ বিভাগগুলি এমআইএম ওয়ার্কস্টেশন (এমআইএম সফ্টওয়্যার, ওহিও, ইউএসএ) থেকে PETEdge+ নামক আধা-স্বয়ংক্রিয় গ্রেডিয়েন্ট-ভিত্তিক সেগমেন্টেশন টুল ব্যবহার করে সঞ্চালিত হয়েছিল।


অটোপেটি লিম্ফোমা পিইটি/সিটি ডেটা এবং তাদের গ্রাউন্ড ট্রুথ সেগমেন্টেশনগুলি ক্যান্সার ইমেজিং আর্কাইভ থেকে অর্জিত হয়েছিল। এই টীকাগুলি জার্মানির ইউনিভার্সিটি হসপিটাল টিউবিনজেন এবং ইউনিভার্সিটি হসপিটাল অফ দ্য এলএমইউ, জার্মানির দুইজন রেডিওলজিস্ট দ্বারা ম্যানুয়ালি করা হয়েছিল৷


B. নেটওয়ার্ক, টুলস এবং কোড


এই কাজে চারটি নেটওয়ার্ককে প্রশিক্ষণ দেওয়া হয়েছিল, যথা, UNet [15], SegResNet [16], DynUNet [17] এবং SwinUNETR [18]। আগের তিনটি হল 3D CNN-ভিত্তিক নেটওয়ার্ক, যেখানে SwinUNETR হল একটি ট্রান্সফরমার-ভিত্তিক নেটওয়ার্ক। এই নেটওয়ার্কগুলির জন্য বাস্তবায়নগুলি MONAI লাইব্রেরি থেকে অভিযোজিত হয়েছিল [19]। মডেলগুলিকে উবুন্টু 16.04 সহ Microsoft Azure ভার্চুয়াল মেশিনে প্রশিক্ষিত এবং যাচাই করা হয়েছিল, যার মধ্যে 24টি CPU কোর (448 GiB RAM) এবং 4টি NVIDIA Tesla V100 GPU (16 GiB RAM প্রতিটি) ছিল। এই কাজের কোডটি MIT লাইসেন্সের অধীনে ওপেন সোর্স করা হয়েছে এবং এই সংগ্রহস্থলে পাওয়া যাবে: https://github.com/microsoft/lymphoma-segmentation-dnn।


C. প্রশিক্ষণ পদ্ধতি


1) ডেটা বিভাজন: দলগুলি থেকে ডেটা (i)-(iii) (মোট 466 টি ক্ষেত্রে অভ্যন্তরীণ দল) এলোমেলোভাবে প্রশিক্ষণ (302 স্ক্যান), বৈধতা (76 স্ক্যান) এবং অভ্যন্তরীণ পরীক্ষা (88 স্ক্যান) সেটগুলিতে বিভক্ত করা হয়েছিল। , যখন AutoPET লিম্ফোমা কোহর্ট (145 স্ক্যান) শুধুমাত্র বাহ্যিক পরীক্ষার জন্য ব্যবহার করা হয়েছিল। মডেলগুলিকে প্রথমে প্রশিক্ষণ সেটে প্রশিক্ষিত করা হয়েছিল, এবং সর্বোত্তম হাইপারপ্যারামিটার এবং সেরা মডেলগুলিকে যাচাইকরণ সেটে নির্বাচন করা হয়েছিল। শীর্ষ মডেলগুলি তারপর অভ্যন্তরীণ এবং বাহ্যিক পরীক্ষার সেটগুলিতে পরীক্ষা করা হয়েছিল। উল্লেখ্য যে অভ্যন্তরীণ কোহর্টের বিভাজন রোগীর স্তরে সঞ্চালিত হয়েছিল যাতে নির্দিষ্ট রোগীদের কাছে প্রশিক্ষিত মডেলের প্যারামিটারগুলি অতিরিক্ত ফিট করা না হয় যদি তাদের একাধিক স্ক্যান প্রশিক্ষণ এবং বৈধতা/পরীক্ষা সেটের মধ্যে ভাগ করা হয়।


2) প্রি-প্রসেসিং এবং অগমেন্টেশন: উচ্চ-রেজোলিউশনের CT চিত্রগুলি (হাউন্সফিল্ড ইউনিটে (HU)) তাদের সংশ্লিষ্ট PET/মাস্ক চিত্রগুলির স্থানাঙ্কের সাথে মেলে নমুনা করা হয়েছিল। Bq/ml ইউনিটে PET তীব্রতার মান ক্ষয় সংশোধন করে SUV-তে রূপান্তরিত করা হয়েছিল। প্রশিক্ষণের সময়, আমরা নেটওয়ার্কে ইনপুট বাড়ানোর জন্য নন-এলোমেলো এবং এলোমেলো রূপান্তরের একটি সিরিজ নিযুক্ত করেছি। নন-এলোমেলো রূপান্তরগুলির মধ্যে রয়েছে (i) ক্লিপিং সিটি তীব্রতা [-154, 325] HU (প্রশিক্ষণ এবং বৈধতা সেট জুড়ে ক্ষতগুলির মধ্যে HU-এর [3, 97]তম কোয়ান্টাইলের প্রতিনিধিত্ব করে) তারপরে সর্বনিম্ন-সর্বোচ্চ স্বাভাবিকীকরণ, (ii) একটি 3D বাউন্ডিং বক্স ব্যবহার করে PET, CT এবং মাস্ক চিত্রগুলিতে শরীরের বাইরে অঞ্চলটি ক্রপ করা এবং (iii) বাইলিনিয়ারের মাধ্যমে (2.0 মিমি, 2.0 মিমি, 2.0 মিমি) আইসোট্রপিক ভক্সেল ব্যবধানে চিত্রগুলিকে পুনরায় স্যাম্পলিং করা PET এবং CT ইমেজের জন্য ইন্টারপোলেশন এবং মাস্ক ইমেজের জন্য নিকটতম-প্রতিবেশী ইন্টারপোলেশন


অন্যদিকে, এলোমেলো রূপান্তরগুলি প্রতিটি যুগের শুরুতে বলা হয়েছিল। এর মধ্যে রয়েছে (i) চিত্রগুলি থেকে এলোমেলোভাবে কিউবিক প্যাচগুলি (N, N, N) ক্রপ করা, যেখানে ঘনক্ষেত্রটি সম্ভাব্যতা pos/(pos + neg) সহ একটি ক্ষত ভক্সেলের চারপাশে বা সম্ভাব্যতা neg/ সহ একটি পটভূমি ভক্সেলের চারপাশে কেন্দ্রীভূত ছিল। (pos + neg), (ii) পরিসরে অনুবাদ (-10, 10) তিনটি দিক বরাবর ভক্সেল, (iii) পরিসরে অক্ষীয় ঘূর্ণন (−π/15, π/15), এবং (iv) এলোমেলো স্কেলিং তিনটি দিকেই 1.1 দ্বারা। আমরা neg = 1 সেট করেছি, এবং pos এবং N যথাক্রমে হাইপারপ্যারামিটার সেট {1, 2, 4, 6, 8, 10, 12, 14, 16} এবং {96, 128, 160, 192, 224, 256} থেকে বেছে নেওয়া হয়েছে ইউনেটের জন্য [২০]। বিস্তৃত বিমোচন পরীক্ষার একটি সিরিজের পরে, pos = 2 এবং N = 224 UNet-এর জন্য সর্বোত্তম বলে পাওয়া গেছে। অন্যান্য নেটওয়ার্কের জন্য, pos 2 তে সেট করা হয়েছিল, এবং প্রশিক্ষণের সময় GPU মেমরিতে অন্তর্ভুক্ত করা যেতে পারে এমন বৃহত্তম N বেছে নেওয়া হয়েছিল (যেহেতু N = 96 ব্যতীত N এর বিভিন্ন মানের জন্য পারফরম্যান্স একে অপরের থেকে উল্লেখযোগ্যভাবে আলাদা ছিল না যা উল্লেখযোগ্যভাবে খারাপ ছিল। N-এর অন্যান্য মানের তুলনায়)। তাই, SegResNet, DynUNet, এবং SwinUNETR যথাক্রমে N = 192, 160 এবং 128 ব্যবহার করে প্রশিক্ষিত হয়েছিল। অবশেষে, নেটওয়ার্কে চূড়ান্ত ইনপুট তৈরি করতে বর্ধিত PET এবং CT প্যাচগুলি চ্যানেল-সংযুক্ত করা হয়েছিল।



4) স্লাইডিং উইন্ডো ইনফারেন্স এবং পোস্টপ্রসেসিং: বৈধতা/পরীক্ষা সেটের চিত্রগুলির জন্য, আমরা শুধুমাত্র নন-এলোমেলো রূপান্তরগুলি নিযুক্ত করেছি। ভবিষ্যদ্বাণীটি সরাসরি 2-চ্যানেল (PET এবং CT) সম্পূর্ণ-বডি ইমেজে তৈরি করা হয়েছিল স্লাইডিং-উইন্ডো কৌশল ব্যবহার করে আকারের একটি কিউবিক উইন্ডো (W, W, W), যেখানে W একটি হাইপারপ্যারামিটার সেট থেকে বেছে নেওয়া হয়েছিল {96 , 128, 160, 192, 224, 256, 288}। সর্বোত্তম মান W পাওয়া গেছে UNet-এর জন্য 224, SegResNet এবং DynUnet-এর জন্য 192, এবং SwinUNETR-এর জন্য 160। পরীক্ষার সেট ভবিষ্যদ্বাণীগুলি মূল্যায়নের মেট্রিক্স গণনার জন্য মূল গ্রাউন্ড ট্রুথ মাস্কগুলির স্থানাঙ্কগুলিতে পুনরায় নমুনা তৈরি করা হয়েছিল।


D. মূল্যায়ন মেট্রিক্স


1) সেগমেন্টেশন মেট্রিক্স: সেগমেন্টেশন পারফরম্যান্স মূল্যায়ন করতে, আমরা রোগী-স্তরের ফোরগ্রাউন্ড ডিএসসি ব্যবহার করেছি, মিথ্যা ইতিবাচক সংযুক্ত উপাদানগুলির ভলিউম যা গ্রাউন্ড ট্রুথ ফোরগ্রাউন্ড (FPV) এর সাথে ওভারল্যাপ করে না এবং গ্রাউন্ড ট্রুথ ফোরগ্রাউন্ডে সংযুক্ত উপাদানগুলির ভলিউম পূর্বাভাসিত সেগমেন্টেশন মাস্ক (FNV) [14] এর সাথে ওভারল্যাপ করবেন না। আমরা অভ্যন্তরীণ এবং বাহ্যিক পরীক্ষার সেটগুলিতে এই মেট্রিকগুলির জন্য মধ্যম এবং আন্তঃকর্তব্য পরিসীমা (IQR) রিপোর্ট করেছি। আমরা গড়ের উপর মানক বিচ্যুতি সহ গড় DSC রিপোর্ট করি। আমরা মধ্যকার মানগুলি রিপোর্ট করতে বেছে নিয়েছি যেহেতু আমাদের গড় মেট্রিক মানগুলি আউটলিয়ারগুলির জন্য প্রবণ ছিল এবং আমাদের নমুনা মধ্যকার নমুনা গড় থেকে DSC (FPV এবং FNV-এর জন্য) এর জন্য সবসময় বেশি (নিম্ন) ছিল। FPV এবং FNV এর একটি চিত্র চিত্র 1 (ক) এ দেওয়া হয়েছে।



  • 2) সনাক্তকরণ মেট্রিক্স:* উপরে আলোচিত বিভাজন মেট্রিকগুলি ছাড়াও, আমরা রোগীর মধ্যে পৃথক ক্ষত সনাক্তকরণের মূল্যায়নের জন্য তিনটি সনাক্তকরণ-ভিত্তিক মেট্রিকের মাধ্যমে পরীক্ষার সেটগুলিতে আমাদের মডেলগুলির কার্যকারিতা মূল্যায়ন করেছি।


চিত্র 1. (ক) দুই-বিভাজন মেট্রিক্স মিথ্যা পজিটিভ ভলিউম (FPV) এবং মিথ্যা নেতিবাচক ভলিউম (FNV) এর চিত্র। (b) তিনটি মানদণ্ডের মাধ্যমে একটি সত্যিকারের ইতিবাচক সনাক্তকরণকে সংজ্ঞায়িত করার দৃষ্টান্ত, যেমনটি ধারা III-D.2 এ ব্যাখ্যা করা হয়েছে।



যদিও সনাক্তকরণ মেট্রিক্স এফপি এবং এফএন-এর সংজ্ঞাগুলি সেগমেন্টেশন মেট্রিক্স এফপিভি এবং এফএনভির মতো দেখা যেতে পারে, সতর্কতার সাথে তদন্তে, তারা নয় (চিত্র 1 (ক) এবং (বি))। FPV এবং FNV মেট্রিক্স সম্পূর্ণরূপে ভুল অবস্থানে ভবিষ্যদ্বাণী করা সমস্ত ক্ষতগুলির ভলিউমগুলির সমষ্টি গণনা করে (গ্রাউন্ড ট্রুথ ক্ষতগুলির সাথে কোনও ওভারল্যাপ নেই) বা ক্ষতগুলি যা সম্পূর্ণ মিস করা হয়েছে। সুতরাং, এই মেট্রিক্সগুলি প্রতিটি রোগীর জন্য ভক্সেল স্তরে সংজ্ঞায়িত করা হয়। অন্যদিকে, সনাক্তকরণ মেট্রিক্স (মাপদণ্ড 1, 2, এবং 3-এ) প্রতিটি রোগীর জন্য প্রতি-ক্ষত ভিত্তিতে সংজ্ঞায়িত করা হয়।




এই ক্ষত পরিমাপের পুনরুত্পাদনযোগ্যতা মূল্যায়ন সেগমেন্টেশন অ্যালগরিদমের ফলাফলে আস্থা বাড়ায়। অতএব, আমরা গ্রাউন্ড ট্রুথ এবং ভবিষ্যদ্বাণীকৃত ক্ষত ব্যবস্থার মধ্যে বণ্টনের উপায়ে বৈষম্য নির্ধারণের জন্য জোড়াযুক্ত ছাত্রদের টি-পরীক্ষা বিশ্লেষণ করেছি (বিভাগ IV-A.1)। উপরন্তু, অনুরূপ বিশ্লেষণগুলি আন্তঃ-পর্যবেক্ষকের পরিবর্তনশীলতা মূল্যায়ন করার জন্য করা হয়েছিল, যার মধ্যে একই চিকিত্সকের দ্বারা একই সেটের ক্ষেত্রে (বিভাগ IV-C) দুটি টীকা তৈরি করা হয়েছিল।


চিত্র 2. 8 টি প্রতিনিধি ক্ষেত্রে করোনাল সর্বাধিক তীব্রতা অভিক্ষেপ দৃশ্যে বিভিন্ন নেটওয়ার্কের পারফরম্যান্সের ভিজ্যুয়ালাইজেশন। (a)- (d) কেসগুলি দেখান যেখানে সমস্ত নেটওয়ার্কের একই পারফরম্যান্স ছিল, যখন (e)-(h) কেসগুলি দেখান যেখানে নেটওয়ার্কগুলির ভিন্ন পারফরম্যান্স ছিল, প্রায়শই তাদের মধ্যে কিছু বড় FPV-এর পূর্বাভাস দেওয়ার কারণে৷ কিছু বিশিষ্ট এফপিভিকে নীল তীর দিয়ে নির্দেশ করা হয়েছে। প্রতিটি প্লটের নীচের ডানদিকের সংখ্যাটি 3D পূর্বাভাসিত মুখোশ এবং স্থল সত্যের মধ্যে DSC দেখায়।


এই কাগজ হল arxiv এ উপলব্ধ CC 4.0 লাইসেন্সের অধীনে।