저자:  (1) He Yingxu, 싱가포르 국립대학교 컴퓨터과학과 {e0139128@u.nus.edu};  (2) 난카이대학교 생명과학대학 Qiqi Sun {sunqiqi1018@gmail.com}.  링크 표   초록 및 소개   방법론   참고자료  참고자료  [1] Armen Aghajanyan, Bernie Huang, Candace Ross, Vladimir Karpukhin, Hu Xu, Naman Goyal, Dmytro Okhonko, Mandar Joshi, Gargi Ghosh, Mike Lewis 및 Luke Zettlemoyer. CM3: 인터넷의 인과 마스크 다중 모드 모델. CoRR, ABS/2201.07520, 2022.  [2] Jian Ding, Nan Xue, Gui-Song Xia, Xiang Bai, Wen Yang, Michael Yang, Serge Belongie, Jiebo Luo, Mihai Datcu, Marcello Pelillo 및 Liangpei Zhang. 항공 이미지의 물체 감지: 대규모 벤치마크 및 과제. 패턴 분석 및 기계 지능에 관한 IEEE 거래, 2021년 1~1페이지.  [3] 존 클라인버그(Jon Kleinberg)와 에바 타도스(Eva Tardos). 알고리즘 디자인. Addison-Wesley Longman Publishing Co., Inc., 미국, 2005. [4] Darius Lam, Richard Kuzma, Kevin McGee, Samuel Dooley, Michael Laielli, Matthew Klaric, Yaroslav Bulatov 및 Brendan McCord. xview: 머리 위 이미지의 맥락에 있는 개체입니다. CoRR, ABS/1802.07856, 2018.  [5] Junnan Li, Dongxu Li, Caiming Xiong 및 Steven CH Hoi. BLIP: 통합된 비전-언어 이해 및 생성을 위한 부트스트래핑 언어-이미지 사전 훈련. CoRR, ABS/2201.12086, 2022.  [6] Xiaoqiang Lu, Binqiang Wang, Xiangtao Zheng 및 Xuelong Li. 원격 감지 이미지 캡션 생성을 위한 모델 및 데이터를 탐색합니다. 지구과학과 원격 탐사에 관한 IEEE 거래, 56(4):2183–2195.  [7] 오픈AI. chatgpt를 소개합니다(2022년 11월).  [8] Ramakrishna Vedantam, C. Lawrence Zitnick 및 Devi Parikh. 사이다: 합의 기반 이미지 설명 평가, 2015.  [9] Jianfeng Wang, Zhengyuan Yang, Xiaowei Hu, Linjie Li, Kevin Lin, Zhe Gan, Zicheng Liu, Ce Liu 및 Lijuan Wang. Git: 시각과 언어를 위한 생성적 이미지를 텍스트로 변환하는 변환기, 2022.  [10] Shunyu Yao, Jeffrey Zhao, Dian Yu, Nan Du, Izhak Shafran, Karthik Narasimhan 및 Yuan Cao. React: 언어 모델에서 추론과 행동의 시너지 효과, 2023.  [11] Xi Ye와 Greg Durrett. 텍스트 추론을 유도하는 몇 장의 설명의 신뢰성 부족, 2022.  [12] Lili Yu, Bowen Shi, Ramakanth Pasunuru, Benjamin Muller, Olga Golovneva, Tianlu Wang, Arun Babu, Binh Tang, Brian Karrer, Shelly Sheynin, Candace Ross, Adam Polyak, Russell Howes, Vasu Sharma, Puxin Xu, Hovhannes Tamoyan , Oron Ashual, Uriel Singer, Shang-Wen Li, Susan Zhang, Richard James, Gargi Ghosh, Yaniv Taigman, Maryam Fazel-Zarandi, Asli Celikyilmaz, Luke Zettlemoyer 및 Armen Aghajanyan. 자동회귀 다중 모달 모델 확장: 사전 학습 및 명령 조정, 2023년.  [13] Wenqi Zhang, Yongliang Shen, Weiming Lu 및 Yueting Zhuang. 데이터 부조종사: 자율적인 워크플로를 통해 수십억 개의 데이터와 인간을 연결, 2023년.  이 문서는 CC BY-NC-SA 4.0 DEED 라이센스에 따라   . arxiv에서 볼 수 있습니다

Part of HackerNoon's growing list of open-source research papers, promoting free access to academic material.

FEW SHOT .tech

이 오디오는 이야기의 원래 언어로 제작되었습니다!

LLM을 사용한 자동 위성 이미지 캡션 생성을 향하여: 참고 문헌

About Author

코멘트

태그 걸기

이 기사는 다음에서 발표되었습니다.

Related Stories

AI/ML 데이터레이크용 참조 아키텍처 구축을 위한 설계자 가이드

State of the Noonion: Building, Selling and Storytelling @ HackerNoon

독특한 생태계를 강화하는 비트코인 UTXO 모델

작업 흐름을 10배 향상하는 방법: 17가지 필수 앱

AI/ML 데이터레이크용 참조 아키텍처 구축을 위한 설계자 가이드

State of the Noonion: Building, Selling and Storytelling @ HackerNoon

독특한 생태계를 강화하는 비트코인 UTXO 모델

작업 흐름을 10배 향상하는 방법: 17가지 필수 앱

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps