저자:
(1) He Yingxu, 싱가포르 국립대학교 컴퓨터과학과 {[email protected]};
(2) 난카이대학교 생명과학대학 Qiqi Sun {[email protected]}.
[1] Armen Aghajanyan, Bernie Huang, Candace Ross, Vladimir Karpukhin, Hu Xu, Naman Goyal, Dmytro Okhonko, Mandar Joshi, Gargi Ghosh, Mike Lewis 및 Luke Zettlemoyer. CM3: 인터넷의 인과 마스크 다중 모드 모델. CoRR, ABS/2201.07520, 2022.
[2] Jian Ding, Nan Xue, Gui-Song Xia, Xiang Bai, Wen Yang, Michael Yang, Serge Belongie, Jiebo Luo, Mihai Datcu, Marcello Pelillo 및 Liangpei Zhang. 항공 이미지의 물체 감지: 대규모 벤치마크 및 과제. 패턴 분석 및 기계 지능에 관한 IEEE 거래, 2021년 1~1페이지.
[3] 존 클라인버그(Jon Kleinberg)와 에바 타도스(Eva Tardos). 알고리즘 디자인. Addison-Wesley Longman Publishing Co., Inc., 미국, 2005. [4] Darius Lam, Richard Kuzma, Kevin McGee, Samuel Dooley, Michael Laielli, Matthew Klaric, Yaroslav Bulatov 및 Brendan McCord. xview: 머리 위 이미지의 맥락에 있는 개체입니다. CoRR, ABS/1802.07856, 2018.
[5] Junnan Li, Dongxu Li, Caiming Xiong 및 Steven CH Hoi. BLIP: 통합된 비전-언어 이해 및 생성을 위한 부트스트래핑 언어-이미지 사전 훈련. CoRR, ABS/2201.12086, 2022.
[6] Xiaoqiang Lu, Binqiang Wang, Xiangtao Zheng 및 Xuelong Li. 원격 감지 이미지 캡션 생성을 위한 모델 및 데이터를 탐색합니다. 지구과학과 원격 탐사에 관한 IEEE 거래, 56(4):2183–2195.
[7] 오픈AI. chatgpt를 소개합니다(2022년 11월).
[8] Ramakrishna Vedantam, C. Lawrence Zitnick 및 Devi Parikh. 사이다: 합의 기반 이미지 설명 평가, 2015.
[9] Jianfeng Wang, Zhengyuan Yang, Xiaowei Hu, Linjie Li, Kevin Lin, Zhe Gan, Zicheng Liu, Ce Liu 및 Lijuan Wang. Git: 시각과 언어를 위한 생성적 이미지를 텍스트로 변환하는 변환기, 2022.
[10] Shunyu Yao, Jeffrey Zhao, Dian Yu, Nan Du, Izhak Shafran, Karthik Narasimhan 및 Yuan Cao. React: 언어 모델에서 추론과 행동의 시너지 효과, 2023.
[11] Xi Ye와 Greg Durrett. 텍스트 추론을 유도하는 몇 장의 설명의 신뢰성 부족, 2022.
[12] Lili Yu, Bowen Shi, Ramakanth Pasunuru, Benjamin Muller, Olga Golovneva, Tianlu Wang, Arun Babu, Binh Tang, Brian Karrer, Shelly Sheynin, Candace Ross, Adam Polyak, Russell Howes, Vasu Sharma, Puxin Xu, Hovhannes Tamoyan , Oron Ashual, Uriel Singer, Shang-Wen Li, Susan Zhang, Richard James, Gargi Ghosh, Yaniv Taigman, Maryam Fazel-Zarandi, Asli Celikyilmaz, Luke Zettlemoyer 및 Armen Aghajanyan. 자동회귀 다중 모달 모델 확장: 사전 학습 및 명령 조정, 2023년.
[13] Wenqi Zhang, Yongliang Shen, Weiming Lu 및 Yueting Zhuang. 데이터 부조종사: 자율적인 워크플로를 통해 수십억 개의 데이터와 인간을 연결, 2023년.
이 문서는 CC BY-NC-SA 4.0 DEED 라이센스에 따라 arxiv에서 볼 수 있습니다 .