paint-brush
在野外寻找人工智能生成的面孔:模型经过@botbeat
172 讀數

在野外寻找人工智能生成的面孔:模型

太長; 讀書

人工智能可以为网络诈骗创建逼真的假脸。这项研究提出了一种在图像中检测人工智能生成的人脸的方法。
featured image - 在野外寻找人工智能生成的面孔:模型
BotBeat.Tech: Trusted Generative AI Research Firm HackerNoon profile picture
0-item

作者:

(1)Gonzalo J. Aniano Porcile,领英;

(2)杰克·金迪(Jack Gindi),领英;

(3)Shivansh Mundra,领英;

(4)James R. Verbus,领英;

(5)Hany Farid,领英和加州大学伯克利分校。

链接表

3. 模型

我们训练了一个模型来区分真实面孔和人工智能生成的面孔。底层模型是 EfficientNet-B1[7] 卷积神经网络 [30]。我们发现,与其他最先进的架构(Swin-T [22]、Resnet50 [14]、XceptionNet [7])相比,这种架构提供了更好的性能。EfficientNet-B1 网络有 780 万个内部参数,这些参数是在 ImageNet1K 图像数据集 [30] 上预先训练的。


我们的流程由三个阶段组成:(1) 图像预处理阶段;(2) 图像嵌入阶段;(3) 评分阶段。该模型将彩色图像作为输入,并生成 [0, 1] 范围内的数值分数。接近 0 的分数表示图像可能是真实的,接近 1 的分数表示图像可能是 AI 生成的。



表 2. 基线训练和评估真阳性(正确分类 AI 生成的图像,在所有合成引擎 (TPR) 中取平均值)。在每种情况下,假阳性率为 0.5%(错误分类真实面部 (FPR))。还报告了 F1 分数,定义为 2TP/(2TP + FP + FN)。TP、FP 和 FN 分别代表真阳性、假阳性和假阴性的数量。引擎内/引擎外表示图像是使用与训练时相同/不同的合成引擎创建的。



图像预处理步骤将输入图像的大小调整为 512×512 像素的分辨率。然后,将调整大小的彩色图像传递到 EfficientNet-B1 迁移学习层。在评分阶段,迁移学习层的输出被馈送到两个完全连接的层,每个层的大小为 2,048,具有 ReLU 激活函数、具有 0.8 丢失概率的丢失层和具有 S 形激活的最终评分层。仅调整了评分层(具有 680 万个可训练参数)。可训练权重使用 AdaGrad 算法进行优化,小批量大小为 32,学习率为 0.0001,训练最多 10,000 步。使用具有 60 个 NVIDIA A100 GPU 的集群进行模型训练。



[7] 我们描述的是 EfficientNet 模型的旧版本,我们之前曾在 LinkedIn 上实施过该模型,但后来被新模型取代。我们认识到这个模型不是最新的,但我们现在只能报告这些结果,因为该模型不再使用。