paint-brush
야생에서 AI가 생성한 얼굴 찾기: 토론, 감사의 말, 참고자료by@botbeat

야생에서 AI가 생성한 얼굴 찾기: 토론, 감사의 말, 참고자료

AI는 온라인 사기에 대비한 현실적인 가짜 얼굴을 만들 수 있습니다. 본 연구에서는 이미지에서 AI가 생성한 얼굴을 검출하는 방법을 제안합니다.
featured image - 야생에서 AI가 생성한 얼굴 찾기: 토론, 감사의 말, 참고자료
BotBeat.Tech: Trusted Generative AI Research Firm HackerNoon profile picture
0-item

저자:

(1) 곤잘로 J. 아니아노 포실(Gonzalo J. Aniano Porcile), LinkedIn;

(2) 잭 긴디, 링크드인;

(3) 시반시 문드라(Shivansh Mundra), 링크드인;

(4) 제임스 R. 버버스(James R. Verbus), 링크드인;

(5) Hany Farid, LinkedIn 및 캘리포니아 대학교 버클리 캠퍼스.

링크 표

5. 토론

많은 이미지 분류 문제의 경우, 적절하게 대표하는 데이터를 갖춘 대규모 신경 모델은 식별 기능을 학습하는 능력 때문에 매력적입니다. 그러나 이러한 모델은 적대적인 공격에 취약할 수 있습니다[4]. 우리 모델이 감지할 수 없는 양의 적대적 노이즈가 모델을 혼란스럽게 만드는 이전 모델만큼 취약한지는 아직 두고 볼 일입니다[3]. 특히, 우리가 학습한 것으로 보이는 명백한 구조적 또는 의미적 인공물이 의도적인 적대적 공격에 대해 더 강력한 견고성을 제공할지는 아직 지켜봐야 합니다.


트랜스코딩, 이미지 크기 조정과 같은 세탁 작업을 포함하여 덜 정교한 공격 측면에서 우리는


그림 5. AI 생성 얼굴 및 정규화된 통합 그라디언트의 예. 우리 모델이 주로 얼굴 영역에 초점을 맞추고 있음을 나타냅니다. (a) 평균 100개의 StyleGAN 2 얼굴, (b) DALL-E 2, (c) Midjourney, (d,e) 안정적인 확산 1,2.


우리 모델은 광범위한 세탁 작업에 걸쳐 탄력성이 있음을 보여주었습니다.


AI 생성 콘텐츠의 생성 및 탐지는 본질적으로 생성자와 탐지기 사이에 다소 예측 가능한 적대적입니다. 탐지가 무의미해 보일 수도 있지만 그렇지 않습니다. 탐지기를 지속적으로 구축함으로써 제작자는 설득력 있는 가짜를 만들기 위해 계속해서 시간과 비용을 투자해야 합니다. 충분히 정교한 제작자는 대부분의 방어를 우회할 수 있지만 일반 제작자는 그렇지 않습니다.


우리와 같은 대규모 온라인 플랫폼에서 운영할 때 이러한 완화(제거는 아님) 전략은 보다 안전한 온라인 공간을 만드는 데 중요합니다. 또한, 성공적인 방어는 하나가 아닌 다양한 아티팩트를 활용하는 다양한 접근 방식을 사용하게 됩니다. 그러한 방어 수단을 모두 우회하는 것은 적에게 심각한 도전이 될 것입니다. 여기에 설명된 접근 방식은 해상도, 품질 및 다양한 합성 엔진에 걸쳐 복원력이 있는 강력한 아티팩트로 보이는 것이 무엇인지 학습함으로써 방어 툴킷에 강력한 새 도구를 추가합니다.

감사의 말

이 작업은 Hany Farid 교수와 LinkedIn의 Trust Data 팀 간의 공동 작업의 산물입니다[10]. AI로 생성된 얼굴을 만드는 데 도움을 준 Matya의 Bohacek에게 감사드립니다. 이러한 협력을 가능하게 해준 LinkedIn Scholars[11] 프로그램에 감사드립니다. 또한 이 작업을 지원해 주신 Ya Xu, Daniel Olmedilla, Kim Capps-Tanaka, Jenelle Bray, Shaunak Chatterjee, Vidit Jain, Ting Chen, Vipin Gupta, Dinesh Palanivelu, Milinda Lakkam 및 Natesh Pillai에게 감사드립니다. StyleGAN 생성 소프트웨어, 훈련된 모델 및 합성 이미지를 공개적으로 사용할 수 있도록 하여 작업을 용이하게 해준 NVIDIA의 David Luebke, Margaret Albrecht, Edwin Nieda, Koki Nagano, George Chellapa, Burak Yoldemir 및 Ankit Patel에게 감사드립니다. 제안.

참고자료

[1] 안정성 AI. https://stability.ai. 1


[2] David Bau, Alex Andonian, Audrey Cui, 박연환, Ali Jahanian, Aude Oliva 및 Antonio Torralba. 단어별로 그림을 그립니다. arXiv:2103.10951, 2021. 1


[3] 니콜라스 칼리니(Nicholas Carlini)와 하니 파리드(Hany Farid). 화이트박스 및 블랙박스 공격으로 딥페이크 이미지 탐지기를 회피합니다. 컴퓨터 비전 및 패턴 인식 워크숍에 관한 IEEE/CVF 컨퍼런스 진행, 658~659페이지, 2020. 7


[4] 니콜라스 칼리니(Nicholas Carlini)와 데이비드 와그너(David Wagner). 신경망의 견고성을 평가합니다. 보안 및 개인 정보 보호에 관한 IEEE 심포지엄, 39~57페이지. IEEE, 2017. 7


[5] Lucy Chai, David Bau, 임서남, 필립 이솔라. 가짜 이미지를 탐지할 수 있는 이유는 무엇입니까? 일반화되는 속성을 이해합니다. 컴퓨터 비전에 관한 유럽 회의, 2020년 103~120페이지. 2


[6] Eric R Chan, Connor Z Lin, Matthew A Chan, Koki Nagano, Boxiao Pan, Shalini De Mello, Orazio Gallo, Leonidas J Guibas, Jonathan Tremblay, Sameh Khamis 등 효율적인 기하학 인식 3D 생성적 적대 네트워크. 컴퓨터 비전 및 패턴 인식에 관한 국제 회의, 페이지 16123–16133, 2022. 2


[7] 프랑수아 숄레. 예외: 깊이 분리 가능한 컨볼루션을 사용한 딥 러닝. arXiv:1610.02357, 2017. 4


[8] Riccardo Corvi, Davide Cozzolino, Giada Zingarini, Giovanni Poggi, Koki Nagano 및 Luisa Verdoliva. 확산 모델에 의해 생성된 합성 이미지 감지에 관한 것입니다. 음향, 음성 및 신호 처리에 관한 국제 회의, 1~5페이지. IEEE, 2023. 2, 5, 7


[9] Chengdong Dong, Ajay Kumar 및 Eryun Liu. 스펙트럼 도메인 각인에서 GAN이 생성한 가짜 이미지를 탐지하기 전에 다시 한 번 생각해보세요. 컴퓨터 비전 및 패턴 인식에 관한 국제 회의, 페이지 7865–7874, 2022. 2


[10] 하니 파리드. 딥 페이크 생성, 사용, 오용 및 탐지. 온라인 신뢰와 안전 저널, 1(4), 2022. 2


[11] Joel Frank, Thorsten Eisenhofer, Lea Schonherr, Asja Fischer, Dorothea Kolossa 및 Thorsten Holz. 딥 페이크 이미지 인식을 위한 빈도 분석 활용. arXiv:2003.08685, 2020. 2


[12] Diego Gragnaniello, Davide Cozzolino, Francesco Marra, Giovanni Poggi 및 Luisa Verdoliva. GAN으로 생성된 이미지는 감지하기 쉬운가요? 현재 상태에 대한 비판적 분석. 멀티미디어 및 엑스포에 관한 IEEE 국제 회의, 2021년 1~6페이지. 2


[13] Hui Guo, Shu Hu, Xin Wang, Ming-Ching Chang 및 Siwei Lyu. 눈이 모든 것을 말해줍니다: 불규칙한 눈동자 모양은 Gan이 생성한 얼굴을 드러냅니다. 음향, 음성 및 신호 처리에 관한 IEEE 국제 회의, 2904-2908페이지. IEEE, 2022. 2


[14] Kaiming He, Xiangyu Zhang, Shaoqing Ren 및 Jian Sun. 이미지 인식을 위한 심층 잔여 학습. arXiv: 1512.03385, 2015. 4


[15] Shu Hu, Yuezun Li, Siwei Lyu. 일관되지 않은 각막 반사 하이라이트를 사용하여 GAN 생성된 얼굴을 노출합니다. 음향, 음성 및 신호 처리에 관한 IEEE 국제 컨퍼런스, 2500-2504페이지. IEEE, 2021. 2


[16] Tero Karras, Timo Aila, Samuli Laine 및 Jaakko Lehtinen. 품질, 안정성 및 변형 개선을 위해 GAN을 점진적으로 성장시킵니다. arXiv:1710.10196, 2017. 1


[17] Tero Karras, Miika Aittala, Samuli Laine, Erik Hark ¨ onen, ¨ Janne Hellsten, Jaakko Lehtinen 및 Timo Aila. 별칭이 없는 생성적 적대 네트워크. 신경정보처리시스템에서, 2021. 1, 2


[18] Tero Karras, Samuli Laine 및 Timo Aila. 생성적 적대 네트워크를 위한 스타일 기반 생성기 아키텍처입니다. 컴퓨터 비전 및 패턴 인식에 관한 국제 컨퍼런스, 페이지 4401–4410, 2019. 1, 2


[19] Tero Karras, Samuli Laine, Miika Aittala, Janne Hellsten, Jaakko Lehtinen 및 Timo Aila. StyleGAN의 이미지 품질을 분석하고 개선합니다. 컴퓨터 비전 및 패턴 인식에 관한 국제 컨퍼런스, 페이지 8110–8119, 2020. 2


[20] David C Knill, David Field, Daniel Kerstent. 프랙탈 이미지에 대한 인간의 차별. JOSA A, 7(6):1113–1123, 1990. 1


[21] Bo Liu, Fan Yang, Xiuli Bi, Bin Xiao, Weisheng Li 및 Xinbo Gao. 생성된 이미지를 실제 이미지로 감지합니다. 컴퓨터 비전에 관한 유럽 회의, 95~110페이지. 스프링어, 2022. 2


[22] Ze Liu, Yutong Lin, Yue Cao, Han Hu, Yixuan Wei, Zheng Zhang, Stephen Lin 및 Baining Guo. Swin 변환기: 이동된 창을 사용하는 계층적 비전 변환기입니다. IEEE/CVF 컴퓨터 비전 국제 컨퍼런스에서, 2021. 4


[23] Shivansh Mundra, Gonzalo J. Aniano Porcile, Smit Marvaniya, James R. Verbus 및 Hany Farid. 컴팩트 임베딩에서 생성된 프로필 사진을 노출합니다. 컴퓨터 비전 및 패턴 인식 워크숍에 관한 국제 컨퍼런스에서, 2023. 2, 7


[24] 소피 J 나이팅게일과 하니 파리드. AI가 합성한 얼굴은 실제 얼굴과 구별하기 어렵고 신뢰도가 더 높습니다. 국립과학원회보, 119(8):e2120481119, 2022. 2


[25] 하비에르 포르틸라(Javier Portilla)와 에로 P 시몬첼리(Eero P Simoncelli). 복잡한 웨이블릿 계수의 결합 통계를 기반으로 하는 파라메트릭 텍스처 모델. 국제 컴퓨터 비전 저널, 40:49–70, 2000. 1


[26] Robin Rombach, Andreas Blattmann, Dominik Lorenz, Patrick Esser 및 Bjorn Ommer. 잠재 확산 모델을 사용한 고해상도 이미지 합성. 컴퓨터 비전 및 패턴 인식에 관한 국제 회의, 페이지 10684–10695, 2022. 1, 4


[27] Pawan Sinha, Benjamin Balas, Yuri Ostrovsky, Richard Russell. 인간의 얼굴 인식: 모든 컴퓨터 비전 연구자들이 알아야 할 19가지 결과. IEEE 간행물, 94(11):1948–1962, 2006. 6


[28] Mukund Sundararajan, Ankur Taly 및 Qiqi Yan. 심층 네트워크에 대한 공리적 속성. arXiv: 1703.01365, 2017. 6


[29] Chuangchuang Tan, Yao Zhao, Shikui Wei, Guanghua Gu 및 Yunchao Wei. 그라디언트 학습: GAN 생성 이미지 감지를 위한 일반화된 아티팩트 표현. 컴퓨터 비전 및 패턴 인식에 관한 국제 회의, 페이지 12105–12114, 2023. 2


[30] Mingxing Tan 및 Quoc V. Le. Efficientnet: 컨벌루션 신경망에 대한 모델 스케일링을 다시 생각합니다. arXiv: 1905.11946, 2020. 4


[31] 피터 톰슨. 마가렛 대처: 새로운 환상입니다. 인식, 9(4):483–484, 1980. 6


[32] 왕성유(Sheng-Yu Wang), 올리버 왕(Oliver Wang), 리처드 장(Richard Zhang), 앤드류 오웬스(Andrew Owens), 알렉세이 A 에프로스(Alexei A Efros). CNN이 생성한 이미지는 현재로서는 놀라울 정도로 쉽게 발견할 수 있습니다. 컴퓨터 비전 및 패턴 인식에 관한 국제 회의, 페이지 8695–8704, 2020. 2


[33] Xin Yang, Yuezun Li, Siwei Lyu. 일관되지 않은 머리 포즈를 사용하여 딥 페이크를 노출합니다. 음향, 음성 및 신호 처리에 관한 IEEE 국제 컨퍼런스, 8261-8265페이지. IEEE, 2019. 2


[34] Xin Yang, Yuezun Li, Honggang Qi 및 Siwei Lyu. 랜드마크 위치를 사용하여 GAN 합성 얼굴을 노출합니다. 정보 은닉 및 멀티미디어 보안에 관한 ACM 워크숍, 2019년 113~118페이지. 2


[35] Xu Zhang, Svebor Karaman 및 Shih-Fu Chang. GAN 가짜 이미지에서 아티팩트를 탐지하고 시뮬레이션합니다. 정보 포렌식 및 보안에 관한 IEEE 국제 워크숍, 2019년 1~6페이지. 2


이 문서는 CC 4.0 라이선스에 따라 arxiv에서 볼 수 있습니다.


[10] 이 작업에 설명된 모델은 LinkedIn 회원에 대한 조치를 취하는 데 사용되지 않습니다.


[11] https://careers.linkedin.com/scholars