paint-brush
Vahşi Doğada Yapay Zekanın Oluşturduğu Yüzleri Bulma: Modelile@botbeat
164 okumalar

Vahşi Doğada Yapay Zekanın Oluşturduğu Yüzleri Bulma: Model

Çok uzun; Okumak

Yapay zeka, çevrimiçi dolandırıcılıklara yönelik gerçekçi sahte yüzler oluşturabilir. Bu çalışma, görüntülerde yapay zeka tarafından oluşturulan yüzleri tespit etmek için bir yöntem önermektedir.
featured image - Vahşi Doğada Yapay Zekanın Oluşturduğu Yüzleri Bulma: Model
BotBeat.Tech: Trusted Generative AI Research Firm HackerNoon profile picture
0-item

Yazarlar:

(1) Gonzalo J. Aniano Porcile, LinkedIn;

(2) Jack Gindi, LinkedIn;

(3) Shivansh Mundra, LinkedIn;

(4) James R. Verbus, LinkedIn;

(5) Hany Farid, LinkedIn ve Kaliforniya Üniversitesi, Berkeley.

Bağlantı Tablosu

3. Modeli

Gerçek yüzleri yapay zeka tarafından oluşturulan yüzlerden ayırt etmek için bir model eğitiyoruz. Temel model EfficientNet-B1[7] evrişimli sinir ağıdır [30]. Bu mimarinin diğer ileri teknoloji mimarilere (Swin-T [22], Resnet50 [14], XceptionNet [7]) kıyasla daha iyi performans sağladığını tespit ettik. EfficientNet-B1 ağı, ImageNet1K görüntü veri kümesinde önceden eğitilmiş 7,8 milyon dahili parametreye sahiptir [30].


İşlem hattımız üç aşamadan oluşur: (1) bir görüntü ön işleme aşaması; (2) bir görüntü yerleştirme aşaması; ve (3) bir puanlama aşaması. Model girdi olarak renkli bir görüntü alır ve [0, 1] aralığında sayısal bir puan üretir. 0'a yakın puanlar görüntünün büyük olasılıkla gerçek olduğunu, 1'e yakın puanlar ise görüntünün muhtemelen yapay zeka tarafından oluşturulduğunu gösterir.



Tablo 2. Temel eğitim ve değerlendirme gerçek pozitif (Yapay zeka tarafından oluşturulan bir görüntünün, tüm sentez motorlarında ortalaması alınan (TPR) doğru şekilde sınıflandırılması). Her durumda, yanlış pozitiflik oranı %0,5'tir (gerçek bir yüzün yanlış sınıflandırılması (FPR)). Ayrıca 2TP/(2TP + FP + FN) olarak tanımlanan F1 puanı da rapor edilir. TP, FP ve FN sırasıyla gerçek pozitiflerin, yanlış pozitiflerin ve yanlış negatiflerin sayısını temsil eder. Motor içi/motor dışı, görüntülerin eğitimde kullanılanlarla aynı/farklı sentez motorlarıyla oluşturulduğunu belirtir.



Görüntü ön işleme adımı, giriş görüntüsünü 512×512 piksel çözünürlüğe yeniden boyutlandırır. Yeniden boyutlandırılan bu renkli görüntü daha sonra EfficientNet-B1 aktarım öğrenme katmanına aktarılır. Puanlama aşamasında, transfer öğrenme katmanının çıktısı, her biri 2.048 boyutunda, bir ReLU aktivasyon fonksiyonuna, 0,8 bırakma olasılığına sahip bir bırakma katmanına ve sigmoidal aktivasyona sahip bir son puanlama katmanına sahip, tamamen bağlı iki katmana beslenir. Yalnızca 6,8 milyon eğitilebilir parametreye sahip puanlama katmanları ayarlanmıştır. Eğitilebilir ağırlıklar, 32 boyutunda bir mini grup, 0,0001 öğrenme oranı ile AdaGrad algoritması kullanılarak optimize edilir ve 10.000 adıma kadar eğitilir. Model eğitimi için 60 adet NVIDIA A100 GPU içeren bir küme kullanıldı.



[7] Daha önce LinkedIn üzerinde faaliyete geçirdiğimiz EfficientNet modelinin daha sonra yerini yeni bir modele bırakan eski bir versiyonunu anlatıyoruz. Bu modelin en yeni model olmadığının farkındayız ancak model artık kullanılmadığından bu sonuçları ancak şimdi raporlayabiliyoruz.