paint-brush
Ինչպես են զգայուն տվյալներն ազդում արդարության և ճշգրտության վրա բժշկական AI մոդելներումկողմից@demographic
Նոր պատմություն

Ինչպես են զգայուն տվյալներն ազդում արդարության և ճշգրտության վրա բժշկական AI մոդելներում

կողմից Demographic3m2024/12/30
Read on Terminal Reader

Չափազանց երկար; Կարդալ

Այս բաժինը համեմատում է արհեստական ինտելեկտի չորս մոդելներ, որոնք օգտագործում են կրծքավանդակի ռենտգենոգրաֆիայի զգայուն ատրիբուտները՝ ցուցադրելով ազդեցությունը արդարության և կատարողականի վրա՝ կենտրոնանալով դրական գումարի արդարության վրա:
featured image - Ինչպես են զգայուն տվյալներն ազդում արդարության և ճշգրտության վրա բժշկական AI մոդելներում
Demographic HackerNoon profile picture
0-item

Հղումների աղյուսակ

  1. Վերացական և ներածություն

  2. Հարակից աշխատանք

  3. Մեթոդներ

    3.1 Դրական գումարային արդարություն

    3.2 Կիրառում

  4. Փորձարկումներ

    4.1 Նախնական արդյունքներ

    4.2 Դրական գումարային արդարություն

  5. Եզրակացություն և հղումներ

3.2 Կիրառում

Արդարության այս հասկացությունը գործնականում կիրառելու և ավանդական խմբային արդարության հետ տարբերությունը ցույց տալու համար մենք համեմատում ենք երեք մոդելներ, որոնք օգտագործում են զգայուն հատկանիշներ բազային մոդելի համար: Մոդելի կողմից զգայուն ատրիբուտների օգտագործման ձևը հայտնի է, որ ազդեցություն ունի մոդելի արդարության և կատարողականի վրա [3,39,41,11]: Հետևաբար, մենք օգտագործում ենք մոդելներ, որոնք բացահայտորեն ներառում են զգայուն ատրիբուտներ, կամ, ընդհակառակը, հեռացնում են ցանկացած ժողովրդագրական կոդավորում մուտքային տվյալներից:


Չորս մոդելները վերապատրաստված են կրծքավանդակի ռադիոգրաֆիայի (CXR) գտածոների բազմակի դասակարգման խնդրի վրա: Բոլոր պարամետրերում օգտագործվում է Densenet-121 [13] ողնաշարը, որը էմպիրիկորեն որոշվել է այս խնդրի համար լավագույն կատարումը տալու համար: Ճշգրիտ մոդելային ճարտարապետությունները ներկայացված են նկար 2-ում և նկարագրված են ստորև.


M1 . ելակետային դասակարգիչ, որն օգտագործում է պատկերները որպես մուտքագրում և վերապատրաստված՝ կանխատեսելու մեր տվյալների բազայի հետ կապված նպատակային CXR բացահայտումները: Մոդելը ներառում է ողնաշար՝ պատկերի առանձնահատկությունները հանելու համար, և հայտնաբերման ճյուղ, որը բաղկացած է լիովին միացված շերտից և երկուական խաչաձև էնտրոպիայի կորստից յուրաքանչյուր գտածոյի համար:


M2 . դասակարգիչ, որն օգտագործում է և՛ պատկերները, և՛ մրցավազքի առանձնահատկությունները որպես մուտքագրում: Մրցավազքի տեղեկատվությունը գալիս է կատեգորիկ փոփոխականի տեսքով, որը մենք վերածում ենք մեկ տաք վեկտորի և կերակրում ենք ամբողջությամբ միացված շերտին: Մենք միացնում ենք հատկանիշները լիովին միացված շերտից և պատկերի առանձնահատկություններից՝ նախքան ճյուղ գտնելը փոխանցելը: Մոդելը վերապատրաստվում է ծայրից ծայր:


M3 . դասակարգիչ, որն օգտագործում է պատկերները միայն որպես մուտքագրում, բայց վարժված է կանխատեսել պատկերների գտածոները, ինչպես նաև ռասայական խումբը (այսինքն այս մոդելը նպատակ ունի օգտագործել նկարներում առկա ռասայական կոդավորումները): Այս մոդելի համար մենք փոփոխում ենք բազային դասակարգչի վերջնական շերտը՝ հարմարեցնելով կորստի ֆունկցիան՝ օպտիմալացնելու երկու առաջադրանքները՝ CXR բացահայտումները և մրցավազքի խումբը: Մենք նաև փոխակերպում ենք ռասայական տեղեկատվությունը մեկ տաք կոդավորված վեկտորի՝ բազմակարգի կորուստ կիրառելու համար: Մրցավազքի դասակարգման ճյուղը կազմված է լիովին միացված շերտից և խաչաձև էնտրոպիայի կորստի ֆունկցիայից։ Վերջնական կորուստը հաշվարկվում է՝ ավելացնելով հայտնաբերման կորուստը և մրցավազքի կորուստը λ քաշի կորստի հետ:



M4 . դասակարգիչ, որն օգտագործում է պատկերները որպես մուտքագրում, որը պատրաստված է պատկերների հայտնաբերումները կանխատեսելու համար՝ միաժամանակ նվազագույնի հասցնելով նկարում կոդավորված ռասայական տեղեկատվության օգտագործումը: Այս մոդելի համար մենք իրականացնում ենք [28]-ում նկարագրված գրադիենտ հակադարձման տեխնիկան: Մենք կիրառում ենք գրադիենտ հակադարձ շերտը մրցավազքի ճյուղից առաջ:


Նկար 2. Զգայուն ատրիբուտների ազդեցությունը կատարողականի և արդարության վրա ուսումնասիրելու համար մենք գնահատում ենք չորս տարբեր մոդելային ճարտարապետություն, որոնք նշվում են M1, M2, M3 և M4: M1, ելակետային գիծը, ունի ողնաշար և դասակարգում: M2-ն ունի մրցավազքի կոդավորման ճյուղ՝ ռասայական կոդավորված հատկանիշներն անմիջապես մետատվյալներից սովորելու համար: M3-ը և M4-ն ունեն մրցավազքի լրացուցիչ ճյուղ՝ պատկերի առանձնահատկություններից կանխատեսելու մրցավազքի խումբը, որը անուղղակիորեն կոդավորված է նկարում: M3-ի և M4-ի տարբերությունը կայանում է նրանում, որ մենք ավելացնում ենք գրադիենտ հակադարձ շերտ մինչև մրցավազքի ճյուղը:


Հեղինակներ:

(1) Samia Belhadj∗, Lunit Inc., Սեուլ, Կորեայի Հանրապետություն ([email protected]);

(2) Sanguk Park [0009 −0005 −0538 −5522]*, Lunit Inc., Սեուլ, Կորեայի Հանրապետություն ([email protected]);

(3) Ambika Seth, Lunit Inc., Սեուլ, Կորեայի Հանրապետություն ([email protected]);

(4) Հեշամ Դար [0009 −0003 −6458 −2097], Lunit Inc., Սեուլ, Կորեայի Հանրապետություն ([email protected]);

(5) Thijs Kooi [0009 −0003 −6458 −2097], Kooi, Lunit Inc., Սեուլ, Կորեայի Հանրապետություն ([email protected]):


Այս փաստաթուղթը հասանելի է arxiv-ում CC BY-NC-SA 4.0 լիցենզիայի ներքո: