लेखक:
(1) यिंगक्सू हे, कंप्यूटर विज्ञान विभाग नेशनल यूनिवर्सिटी ऑफ़ सिंगापुर {[email protected]};
(2) क्युकी सन, कॉलेज ऑफ लाइफ साइंसेज नानकाई यूनिवर्सिटी {[email protected]}.
[1] आर्मेन अघाजन्यान, बर्नी हुआंग, कैंडेस रॉस, व्लादिमीर करपुखिन, हू जू, नमन गोयल, दिमित्रो ओखोन्को, मंदार जोशी, गार्गी घोष, माइक लुईस और ल्यूक ज़ेटलमॉयर। CM3: इंटरनेट का एक कारणपूर्ण मास्क्ड मल्टीमॉडल मॉडल। CoRR, abs/2201.07520, 2022।
[2] जियान डिंग, नान ज़ू, गुई-सोंग ज़िया, जियांग बाई, वेन यांग, माइकल यांग, सर्ज बेलोंगी, जिएबो लुओ, मिहाई डाटकू, मार्सेलो पेलिलो और लियांगपेई झांग। हवाई छवियों में ऑब्जेक्ट डिटेक्शन: एक बड़े पैमाने पर बेंचमार्क और चुनौतियाँ। IEEE ट्रांजेक्शन ऑन पैटर्न एनालिसिस एंड मशीन इंटेलिजेंस, पेज 1–1, 2021।
[3] जॉन क्लेनबर्ग और ईवा टार्डोस। एल्गोरिदम डिज़ाइन। एडिसन-वेस्ले लॉन्गमैन पब्लिशिंग कंपनी, इंक., यूएसए, 2005। [4] डेरियस लैम, रिचर्ड कुज़्मा, केविन मैकगी, सैमुअल डूली, माइकल लैली, मैथ्यू क्लैरिक, यारोस्लाव बुलाटोव और ब्रेंडन मैककॉर्ड। एक्सव्यू: ओवरहेड इमेजरी में संदर्भ में ऑब्जेक्ट। CoRR, abs/1802.07856, 2018।
[5] जुन्नान ली, डोंगक्सू ली, कैमिंग ज़ियोनग, और स्टीवन सीएच होई। बीएलआईपी: एकीकृत दृष्टि-भाषा समझ और निर्माण के लिए भाषा-छवि पूर्व-प्रशिक्षण को बूटस्ट्रैप करना। सीओआरआर, एब्स/2201.12086, 2022।
[6] शियाओकियांग लू, बिनकियांग वांग, ज़ियांगताओ झेंग और ज़ुएलोंग ली। रिमोट सेंसिंग इमेज कैप्शन जेनरेशन के लिए मॉडल और डेटा की खोज। IEEE ट्रांजेक्शन ऑन जियोसाइंस एंड रिमोट सेंसिंग, 56(4):2183–2195।
[7] ओपनएआई. चैटजीपीटी का परिचय, नवंबर 2022.
[8] रामकृष्ण वेदांतम, सी. लॉरेंस ज़िटनिक और देवी पारिख। साइडर: आम सहमति आधारित छवि विवरण मूल्यांकन, 2015।
[9] जियानफ़ेंग वांग, झेंगयुआन यांग, ज़ियाओवेई हू, लिंज़ी ली, केविन लिन, झे गण, ज़िचेंग लियू, सी लियू, और लिजुआन वांग। गिट: दृष्टि और भाषा के लिए एक जनरेटिव इमेज-टू-टेक्स्ट ट्रांसफॉर्मर, 2022।
[10] शुन्यु याओ, जेफ़री झाओ, डियान यू, नान डू, इज़हाक शफ़रान, कार्तिक नरसिम्हन, और युआन काओ। रिएक्ट: भाषा मॉडल में तर्क और अभिनय का तालमेल, 2023।
[11] शी यी और ग्रेग ड्यूरेट। पाठ्य तर्क के लिए कुछ-शॉट संकेत में स्पष्टीकरण की अविश्वसनीयता, 2022।
[12] लिली यू, बोवेन शि, रमाकांत पासुनुरु, बेंजामिन मुलर, ओल्गा गोलोवनेवा, तियानलू वांग, अरुण बाबू, बिन्ह तांग, ब्रायन करर, शेली शेइनिन, कैंडेस रॉस, एडम पोलाक, रसेल होवेस, वासु शर्मा, पुक्सिन जू, होवनेस तामोयान, ओरोन अशुएल, उरीएल सिंगर, शांग-वेन ली, सुसान झांग, रिचर्ड जेम्स, गार्गी घोष, यानिव ताइगमैन, मरियम फज़ल-ज़रंडी, असली सेलिकिलमाज़, ल्यूक ज़ेटलमॉयर और आर्मेन अघाजन्यान। ऑटोरेग्रसिव मल्टी-मोडल मॉडल को स्केल करना: प्रीट्रेनिंग और इंस्ट्रक्शन ट्यूनिंग, 2023।
[13] वेनकी झांग, योंगलियांग शेन, वीमिंग लू और यूटिंग झुआंग। डेटा-कोपायलट: स्वायत्त वर्कफ़्लो के साथ अरबों डेटा और मनुष्यों को जोड़ना, 2023।