Autoriai:
(1) Robertas Honigas, ETH Ciurichas ([email protected]);
(2) Javieras Rando, Ciuricho ETH ([email protected]);
(3) Nicholas Carlini, „Google DeepMind“;
(4) Florianas Trameris, ETH Ciurichas ([email protected]).
D. Skirtumai su glazūros koregavimu
H. Esamos stiliaus mimikos apsaugos
Menininkai vis labiau nerimauja dėl vaizdų generavimo modelių, kurie gali glaudžiai atkartoti jų unikalius meninius stilius, pažanga. Reaguodama į tai, buvo sukurtos kelios apsaugos nuo stiliaus mimikos priemonės, kurios į internete skelbiamus meno kūrinius įtraukė nedidelius priešiškus trukdžius. Šiame darbe vertiname populiarių apsaugos priemonių (su milijonais atsisiuntimų) efektyvumą ir parodome, kad jos suteikia tik klaidingą saugumo jausmą. Pastebime, kad mažai pastangų reikalaujančių ir „paprastų“ metodų, tokių kaip vaizdo mastelio keitimas, pakanka sukurti tvirtus mimikos metodus, kurie gerokai pablogina esamą apsaugą. Atlikdami naudotojų tyrimą, parodome, kad visas esamas apsaugos priemones galima lengvai apeiti, todėl menininkai gali būti pažeidžiami stiliaus mimikos. Įspėjame, kad priešpriešiniais trukdžiais pagrįsti įrankiai negali patikimai apsaugoti menininkų nuo netinkamo generatyvaus AI naudojimo, ir raginame kurti alternatyvius apsaugos sprendimus.
Stiliaus mimika yra populiari teksto į vaizdą generuojamųjų modelių taikymas. Atsižvelgiant į keletą menininko vaizdų, modelis gali būti tiksliai suderintas, kad būtų sukurti nauji tokio stiliaus vaizdai (pvz., Van Gogho stiliaus erdvėlaivis). Tačiau netinkamai naudojama stiliaus mimika gali padaryti didelę žalą. Visų pirma, daugelis šiuolaikinių menininkų nerimauja, kad kiti dabar gali sukurti vaizdus, kurie kopijuoja jų unikalų meno stilių ir gali pavogti klientus (Heikkila¨, 2022). Kaip atsakas buvo sukurtos kelios apsaugos priemonės, skirtos apsaugoti menininkus nuo stiliaus mimikos (Shan ir kt., 2023a; Van Le ir kt., 2023; Liang ir kt., 2023). Šios apsaugos priemonės prideda priešiškų trikdžių vaizdams, kuriuos menininkai skelbia internete, kad būtų slopinamas koregavimo procesas. Šios apsaugos sulaukė didelio žiniasklaidos dėmesio (su funkcijomis New York Times (Hill, 2023), CNN (Thorbecke, 2023) ir Scientific American (Leffer, 2023) ir buvo atsisiųstos daugiau nei 1 milijoną kartų (Shan ir kt. , 2023a).
Tačiau neaišku, kiek šios priemonės iš tikrųjų apsaugo menininkus nuo stiliaus mimikos, ypač jei kas nors aktyviai bando jas apeiti (Radiya-Dixit ir kt., 2021). Šiame darbe parodome, kad moderniausios stiliaus apsaugos priemonės – glazūra (Shan ir kt., 2023a), rūkas (Liang ir kt., 2023) ir Anti-DreamBooth (Van Le ir kt., 2023) – yra neveiksmingi, kai susiduriama su paprastais tvirtais mimikos metodais. Tvirti mimikos metodai, kuriuos mes svarstome, svyruoja nuo mažai pastangų reikalaujančių strategijų, pvz., naudojant kitokį koreguojantį scenarijų arba į vaizdus įtraukiant Gauso triukšmą prieš treniruotę, iki kelių etapų strategijų, kuriose derinami jau paruošti įrankiai. Savo rezultatus patvirtiname atlikdami naudotojo tyrimą, kuris atskleidžia, kad patikimi mimikos metodai gali duoti rezultatus, kurių kokybė nesiskiria nuo tų, kurie gaunami iš neapsaugotų meno kūrinių (žr. 1 paveikslą, kuriame pateikiamas iliustratyvus pavyzdys).
Mes parodome, kad esamos apsaugos priemonės tik suteikia klaidingą saugumo jausmą. Mūsų tvirtiems mimikos metodams nereikia kurti naujų įrankių ar koreguoti metodus, o tik atsargiai
derinant standartines vaizdo apdorojimo technologijas, kurios jau egzistavo tuo metu, kai buvo pristatytos šios apsaugos priemonės!. Todėl manome, kad net žemos kvalifikacijos klastotojai galėjo lengvai apeiti šiuos įrankius nuo pat jų įkūrimo.
Nors vertiname konkrečias šiandien egzistuojančias apsaugos priemones, stiliaus mimikos apsaugos apribojimai yra būdingi. Menininkai būtinai atsiduria nepalankioje padėtyje, nes pirmiausia turi veikti (ty kai kas nors atsisiunčia saugomą meną, apsaugos nebegalima pakeisti). Kad apsauginės priemonės būtų veiksmingos, jos susiduria su sudėtinga užduotimi sukurti trikdžius, kurie perkeliami į bet kokią koregavimo techniką, net ir tuos, kurie ateityje pasirenkami adaptyviai. Panašią išvadą padarė Radiya-Dixit ir kt. (Radiya-Dixit ir kt., 2021), kurie teigė, kad priešingi trikdžiai negali apsaugoti vartotojų nuo veido atpažinimo sistemų. Todėl įspėjame, kad priešpriešiniai mašininio mokymosi metodai negalės patikimai apsaugoti menininkų nuo generatyvaus stiliaus mimikos, ir raginame kurti alternatyvias priemones menininkams apsaugoti.
Prieš paskelbdami savo rezultatus atskleidėme paveiktoms apsaugos priemonėms, kad jos galėtų nustatyti geriausią esamų naudotojų veiksmų būdą.
Šis popierius yra