paint-brush
LLM을 사용한 자동 위성 이미지 캡션 생성을 향하여: 참고 문헌~에 의해@fewshot
113 판독값

LLM을 사용한 자동 위성 이미지 캡션 생성을 향하여: 참고 문헌

~에 의해 The FewShot Prompting Publication 2m2024/06/16
Read on Terminal Reader

너무 오래; 읽다

연구원들은 LLM 및 API를 사용하여 정확도를 향상시키고 사람의 주석 요구를 줄이는 원격 감지 이미지 캡션 방법인 ARSIC을 제시합니다.
featured image - LLM을 사용한 자동 위성 이미지 캡션 생성을 향하여: 참고 문헌
The FewShot Prompting Publication  HackerNoon profile picture
0-item

저자:

(1) He Yingxu, 싱가포르 국립대학교 컴퓨터과학과 {[email protected]};

(2) 난카이대학교 생명과학대학 Qiqi Sun {[email protected]}.

링크 표

참고자료

[1] Armen Aghajanyan, Bernie Huang, Candace Ross, Vladimir Karpukhin, Hu Xu, Naman Goyal, Dmytro Okhonko, Mandar Joshi, Gargi Ghosh, Mike Lewis 및 Luke Zettlemoyer. CM3: 인터넷의 인과 마스크 다중 모드 모델. CoRR, ABS/2201.07520, 2022.


[2] Jian Ding, Nan Xue, Gui-Song Xia, Xiang Bai, Wen Yang, Michael Yang, Serge Belongie, Jiebo Luo, Mihai Datcu, Marcello Pelillo 및 Liangpei Zhang. 항공 이미지의 물체 감지: 대규모 벤치마크 및 과제. 패턴 분석 및 기계 지능에 관한 IEEE 거래, 2021년 1~1페이지.


[3] 존 클라인버그(Jon Kleinberg)와 에바 타도스(Eva Tardos). 알고리즘 디자인. Addison-Wesley Longman Publishing Co., Inc., 미국, 2005. [4] Darius Lam, Richard Kuzma, Kevin McGee, Samuel Dooley, Michael Laielli, Matthew Klaric, Yaroslav Bulatov 및 Brendan McCord. xview: 머리 위 이미지의 맥락에 있는 개체입니다. CoRR, ABS/1802.07856, 2018.


[5] Junnan Li, Dongxu Li, Caiming Xiong 및 Steven CH Hoi. BLIP: 통합된 비전-언어 이해 및 생성을 위한 부트스트래핑 언어-이미지 사전 훈련. CoRR, ABS/2201.12086, 2022.


[6] Xiaoqiang Lu, Binqiang Wang, Xiangtao Zheng 및 Xuelong Li. 원격 감지 이미지 캡션 생성을 위한 모델 및 데이터를 탐색합니다. 지구과학과 원격 탐사에 관한 IEEE 거래, 56(4):2183–2195.


[7] 오픈AI. chatgpt를 소개합니다(2022년 11월).


[8] Ramakrishna Vedantam, C. Lawrence Zitnick 및 Devi Parikh. 사이다: 합의 기반 이미지 설명 평가, 2015.


[9] Jianfeng Wang, Zhengyuan Yang, Xiaowei Hu, Linjie Li, Kevin Lin, Zhe Gan, Zicheng Liu, Ce Liu 및 Lijuan Wang. Git: 시각과 언어를 위한 생성적 이미지를 텍스트로 변환하는 변환기, 2022.


[10] Shunyu Yao, Jeffrey Zhao, Dian Yu, Nan Du, Izhak Shafran, Karthik Narasimhan 및 Yuan Cao. React: 언어 모델에서 추론과 행동의 시너지 효과, 2023.


[11] Xi Ye와 Greg Durrett. 텍스트 추론을 유도하는 몇 장의 설명의 신뢰성 부족, 2022.


[12] Lili Yu, Bowen Shi, Ramakanth Pasunuru, Benjamin Muller, Olga Golovneva, Tianlu Wang, Arun Babu, Binh Tang, Brian Karrer, Shelly Sheynin, Candace Ross, Adam Polyak, Russell Howes, Vasu Sharma, Puxin Xu, Hovhannes Tamoyan , Oron Ashual, Uriel Singer, Shang-Wen Li, Susan Zhang, Richard James, Gargi Ghosh, Yaniv Taigman, Maryam Fazel-Zarandi, Asli Celikyilmaz, Luke Zettlemoyer 및 Armen Aghajanyan. 자동회귀 다중 모달 모델 확장: 사전 학습 및 명령 조정, 2023년.


[13] Wenqi Zhang, Yongliang Shen, Weiming Lu 및 Yueting Zhuang. 데이터 부조종사: 자율적인 워크플로를 통해 수십억 개의 데이터와 인간을 연결, 2023년.


이 문서는 CC BY-NC-SA 4.0 DEED 라이센스에 따라 arxiv에서 볼 수 있습니다 .