为什么视觉变形金刚专注于无聊的背景?经过@mikeyoung44
1,199 讀數

为什么视觉变形金刚专注于无聊的背景?

2023/10/02
5m
经过 @mikeyoung44 1,199 讀數
tldt arrow
ZH
Read on Terminal Reader

太長; 讀書

视觉变换器 (ViT) 在图像相关任务中广受欢迎,但表现出奇怪的行为:专注于不重要的背景块而不是图像中的主要主题。研究人员发现,一小部分具有异常高 L2 规范的补丁令牌导致了这些注意力的激增。他们假设 ViT 回收低信息补丁来存储全局图像信息,从而导致了这种行为。为了解决这个问题,他们建议添加“注册”令牌来提供专用存储,从而获得更平滑的注意力图、更好的性能并提高对象发现能力。这项研究强调了持续研究模型工件以提高变压器能力的必要性。
featured image - 为什么视觉变形金刚专注于无聊的背景?
Mike Young HackerNoon profile picture

@mikeyoung44

Mike Young

Among other things, launching AIModels.fyi ... Find the right AI model for your project - https://aimodels.fyi


Credibility

react to story with heart
Mike Young HackerNoon profile picture
by Mike Young @mikeyoung44.Among other things, launching AIModels.fyi ... Find the right AI model for your project - https://aimodels.fyi
Read my stories

相關故事

L O A D I N G
. . . comments & more!