paint-brush
LLM を使用した衛星画像のキャプションの自動生成に向けて: 参考文献@fewshot
113 測定値

LLM を使用した衛星画像のキャプションの自動生成に向けて: 参考文献

長すぎる; 読むには

研究者らは、LLM と API を使用してリモート センシング画像のキャプションを付ける方法である ARSIC を発表し、精度を向上させ、人間による注釈の必要性を減らします。
featured image - LLM を使用した衛星画像のキャプションの自動生成に向けて: 参考文献
The FewShot Prompting Publication  HackerNoon profile picture
0-item

著者:

(1)Yingxu He、シンガポール国立大学コンピュータサイエンス学部 {[email protected]}

(2)南開大学生命科学学院、Qiqi Sun {[email protected]}。

リンク一覧

参考文献

[1] Armen Aghajanyan、Bernie Huang、Candace Ross、Vladimir Karpukhin、Hu Xu、Naman Goyal、Dmytro Okhonko、Mandar Joshi、Gargi Ghosh、Mike Lewis、およびLuke Zettlemoyer。CM3:インターネットの因果マスクマルチモーダルモデル。CoRR、abs / 2201.07520、2022。


[2] Jian Ding、Nan Xue、Gui-Song Xia、Xiang Bai、Wen Yang、Michael Yang、Serge Belongie、Jiebo Luo、Mihai Datcu、Marcello Pelillo、Liangpei Zhang。航空写真における物体検出:大規模ベンチマークと課題。IEEE Transactions on Pattern Analysis and Machine Intelligence、1-1ページ、2021年。


[3] ジョン・クラインバーグとエヴァ・タルドス。アルゴリズム設計。Addison-Wesley Longman Publishing Co., Inc.、米国、2005年。[4] ダリウス・ラム、リチャード・クズマ、ケビン・マギー、サミュエル・ドゥーリー、マイケル・ライエリ、マシュー・クラリック、ヤロスラフ・ブラトフ、ブレンダン・マコード。xview:頭上画像におけるコンテキスト内のオブジェクト。CoRR、abs / 1802.07856、2018年。


[5] Junnan Li、Dongxu Li、Caiming Xiong、Steven CH Hoi。BLIP:統合された視覚言語理解と生成のための言語-画像事前トレーニングのブートストラップ。CoRR、abs / 2201.12086、2022。


[6] Xiaoqiang Lu、Binqiang Wang、Xiangtao Zheng、Xuelong Li。リモートセンシング画像キャプション生成のためのモデルとデータの探索。IEEE Transactions on Geoscience and Remote Sensing、56(4):2183–2195。


[7] OpenAI.chatgptの紹介、2022年11月。


[8] Ramakrishna Vedantam、C. Lawrence Zitnick、Devi Parikh。Cider:コンセンサスベースの画像記述評価、2015年。


[9] 江鋒王、鄭元楊、暁偉胡、林潔李、林克己、浙江、劉子成、劉哲、王立娟。 Git: 視覚と言語のための画像からテキストへの生成的変換器、2022 年。


[10] Shunyu Yao、Jeffrey Zhao、Dian Yu、Nan Du、Izhak Shafran、Karthik Narasimhan、Yuan Cao。React:言語モデルにおける推論と動作の相乗効果、2023年。


[11] Xi YeとGreg Durrett。テキスト推論のための少数ショットプロンプトにおける説明の信頼性の低さ、2022年。


[12] Lili Yu、Bowen Shi、Ramakanth Pasunuru、Benjamin Muller、Olga Golovneva、Tianlu Wang、Arun Babu、Binh Tang、Brian Karrer、Shelly Sheynin、Candace Ross、Adam Polyak、Russell Howes、Vasu Sharma、Puxin Xu、Hovhannes Tamoyan、Oron Ashual、Uriel Singer、Shang-Wen Li、Susan Zhang、Richard James、Gargi Ghosh、Yaniv Taigman、Maryam Fazel-Zarandi、Asli Celikyilmaz、Luke Zettlemoyer、Armen Aghajanyan。自己回帰マルチモーダルモデルのスケーリング:事前トレーニングと指示チューニング、2023年。


[13] Wenqi Zhang、Yongliang Shen、Weiming Lu、Yueting Zhuang。データコパイロット:自律ワークフローで数十億のデータと人間をつなぐ、2023年。


この論文は、CC BY-NC-SA 4.0 DEED ライセンスの下でarxiv で公開されています