paint-brush
Hur känsliga data påverkar rättvisa och noggrannhet i medicinska AI-modellerförbi@demographic
Ny historia

Hur känsliga data påverkar rättvisa och noggrannhet i medicinska AI-modeller

förbi Demographic3m2024/12/30
Read on Terminal Reader

För länge; Att läsa

Det här avsnittet jämför fyra AI-modeller som använder känsliga attribut i bröströntgen, vilket visar effekterna på rättvisa och prestanda, med fokus på positiv summa rättvisa.
featured image - Hur känsliga data påverkar rättvisa och noggrannhet i medicinska AI-modeller
Demographic HackerNoon profile picture
0-item

Tabell över länkar

  1. Abstrakt och introduktion

  2. Relaterat arbete

  3. Metoder

    3.1 Positiv summa rättvisa

    3.2 Tillämpning

  4. Experiment

    4.1 Inledande resultat

    4.2 Positiv summa rättvisa

  5. Slutsats och referenser

3.2 Tillämpning

För att omsätta denna rättviseuppfattning i praktiken och visa skillnaden mot traditionell grupprättvisa jämför vi tre modeller som använder känsliga attribut med en baslinjemodell. Det sätt på vilket känsliga attribut används av modellen är känt för att ha en inverkan på modellens rättvisa och prestanda [3,39,41,11]. Därför använder vi modeller som uttryckligen inkluderar känsliga attribut, eller omvänt tar vi bort all demografisk kodning från indata.


De fyra modellerna är tränade på ett multi-label klassificeringsproblem av fynd i chest radiography (CXR). I alla inställningar används en Densenet-121 [13] ryggrad, som var empiriskt fastställd för att ge bästa prestanda för detta problem. De exakta modellarkitekturerna visas i figur 2 och beskrivs nedan:


M1 : en baslinjeklassificerare som använder bilderna som indata och tränas för att förutsäga de riktade CXR-fynd som är kopplade till vår datauppsättning. Modellen består av en ryggrad för att extrahera bildegenskaperna och en fyndgren bestående av ett helt sammankopplat lager och en binär korsentropiförlust för varje fynd.


M2 : en klassificerare som använder både bilderna och rasfunktionerna som indata. Rasinformationen kommer i form av en kategorisk variabel, som vi konverterar till en envarm vektor och matar till ett helt sammankopplat lager. Vi sammanfogar funktionerna från det helt anslutna lagret och bildfunktionerna innan vi vidarebefordrar till att hitta gren. Modellen tränas från början till slut.


M3 : en klassificerare som endast använder bilderna som indata, men tränad att förutsäga bildfynd såväl som rasgruppen (dvs. denna modell syftar till att utnyttja raskodningarna som finns i bilderna). För denna modell modifierar vi det sista lagret av baslinjeklassificeraren genom att anpassa förlustfunktionen för att optimera de två uppgifterna: CXR-fynd och rasgrupp. Vi omvandlar också rasinformation till en-hot-kodad vektor för att tillämpa multi-klass förlust. Rasklassificeringsgrenen är gjord av ett helt sammankopplat lager och en korsentropiförlustfunktion. Den slutliga förlusten beräknas genom att lägga till fyndförlust och rasförlusten med en förlustvikt λ.



M4 : en klassificerare som använder bilderna som indata, tränad att förutsäga bildfynd, samtidigt som man minimerar användningen av rasinformation kodad i bilden. För denna modell implementerar vi den gradientvändningsteknik som beskrivs i [28]. Vi applicerar gradientomkastningsskiktet före rasgrenen.


Fig. 2: För att undersöka effekten av känsliga attribut på prestanda och rättvisa, utvärderar vi fyra olika modellarkitekturer, betecknade M1, M2, M3 och M4. M1, baslinjen, har en ryggrad och klassificering. M2 har en raskodningsgren för att lära sig raskodade funktioner direkt från metadata. M3 och M4 har en extra rasgren för att förutsäga rasgruppen som är implicit kodad i bilden, från bildegenskaperna. Skillnaden mellan M3 och M4 är att vi lägger till ett gradientomkastningslager innan loppgrenen.


Författare:

(1) Samia Belhadj∗, Lunit Inc., Seoul, Republiken Korea ([email protected]);

(2) Sanguk Park [0009 −0005 −0538 −5522]*, Lunit Inc., Seoul, Republiken Korea ([email protected]);

(3) Ambika Seth, Lunit Inc., Seoul, Republiken Korea ([email protected]);

(4) Hesham Dar [0009 −0003 −6458 −2097], Lunit Inc., Seoul, Republiken Korea ([email protected]);

(5) Thijs Kooi [0009 −0003 −6458 −2097], Kooi, Lunit Inc., Seoul, Republiken Korea ([email protected]).


Detta dokument är tillgängligt på arxiv under CC BY-NC-SA 4.0-licens.