लेखक:  (1) यिंगक्सू हे, कंप्यूटर विज्ञान विभाग नेशनल यूनिवर्सिटी ऑफ़ सिंगापुर {e0139128@u.nus.edu};  (2) क्युकी सन, कॉलेज ऑफ लाइफ साइंसेज नानकाई यूनिवर्सिटी {sunqiqi1018@gmail.com}.  लिंक की तालिका   सार और परिचय   क्रियाविधि   संदर्भ  संदर्भ  [1] आर्मेन अघाजन्यान, बर्नी हुआंग, कैंडेस रॉस, व्लादिमीर करपुखिन, हू जू, नमन गोयल, दिमित्रो ओखोन्को, मंदार जोशी, गार्गी घोष, माइक लुईस और ल्यूक ज़ेटलमॉयर। CM3: इंटरनेट का एक कारणपूर्ण मास्क्ड मल्टीमॉडल मॉडल। CoRR, abs/2201.07520, 2022।  [2] जियान डिंग, नान ज़ू, गुई-सोंग ज़िया, जियांग बाई, वेन यांग, माइकल यांग, सर्ज बेलोंगी, जिएबो लुओ, मिहाई डाटकू, मार्सेलो पेलिलो और लियांगपेई झांग। हवाई छवियों में ऑब्जेक्ट डिटेक्शन: एक बड़े पैमाने पर बेंचमार्क और चुनौतियाँ। IEEE ट्रांजेक्शन ऑन पैटर्न एनालिसिस एंड मशीन इंटेलिजेंस, पेज 1–1, 2021।  [3] जॉन क्लेनबर्ग और ईवा टार्डोस। एल्गोरिदम डिज़ाइन। एडिसन-वेस्ले लॉन्गमैन पब्लिशिंग कंपनी, इंक., यूएसए, 2005। [4] डेरियस लैम, रिचर्ड कुज़्मा, केविन मैकगी, सैमुअल डूली, माइकल लैली, मैथ्यू क्लैरिक, यारोस्लाव बुलाटोव और ब्रेंडन मैककॉर्ड। एक्सव्यू: ओवरहेड इमेजरी में संदर्भ में ऑब्जेक्ट। CoRR, abs/1802.07856, 2018।  [5] जुन्नान ली, डोंगक्सू ली, कैमिंग ज़ियोनग, और स्टीवन सीएच होई। बीएलआईपी: एकीकृत दृष्टि-भाषा समझ और निर्माण के लिए भाषा-छवि पूर्व-प्रशिक्षण को बूटस्ट्रैप करना। सीओआरआर, एब्स/2201.12086, 2022।  [6] शियाओकियांग लू, बिनकियांग वांग, ज़ियांगताओ झेंग और ज़ुएलोंग ली। रिमोट सेंसिंग इमेज कैप्शन जेनरेशन के लिए मॉडल और डेटा की खोज। IEEE ट्रांजेक्शन ऑन जियोसाइंस एंड रिमोट सेंसिंग, 56(4):2183–2195।  [7] ओपनएआई. चैटजीपीटी का परिचय, नवंबर 2022.  [8] रामकृष्ण वेदांतम, सी. लॉरेंस ज़िटनिक और देवी पारिख। साइडर: आम सहमति आधारित छवि विवरण मूल्यांकन, 2015।  [9] जियानफ़ेंग वांग, झेंगयुआन यांग, ज़ियाओवेई हू, लिंज़ी ली, केविन लिन, झे गण, ज़िचेंग लियू, सी लियू, और लिजुआन वांग। गिट: दृष्टि और भाषा के लिए एक जनरेटिव इमेज-टू-टेक्स्ट ट्रांसफॉर्मर, 2022।  [10] शुन्यु याओ, जेफ़री झाओ, डियान यू, नान डू, इज़हाक शफ़रान, कार्तिक नरसिम्हन, और युआन काओ। रिएक्ट: भाषा मॉडल में तर्क और अभिनय का तालमेल, 2023।  [11] शी यी और ग्रेग ड्यूरेट। पाठ्य तर्क के लिए कुछ-शॉट संकेत में स्पष्टीकरण की अविश्वसनीयता, 2022।  [12] लिली यू, बोवेन शि, रमाकांत पासुनुरु, बेंजामिन मुलर, ओल्गा गोलोवनेवा, तियानलू वांग, अरुण बाबू, बिन्ह तांग, ब्रायन करर, शेली शेइनिन, कैंडेस रॉस, एडम पोलाक, रसेल होवेस, वासु शर्मा, पुक्सिन जू, होवनेस तामोयान, ओरोन अशुएल, उरीएल सिंगर, शांग-वेन ली, सुसान झांग, रिचर्ड जेम्स, गार्गी घोष, यानिव ताइगमैन, मरियम फज़ल-ज़रंडी, असली सेलिकिलमाज़, ल्यूक ज़ेटलमॉयर और आर्मेन अघाजन्यान। ऑटोरेग्रसिव मल्टी-मोडल मॉडल को स्केल करना: प्रीट्रेनिंग और इंस्ट्रक्शन ट्यूनिंग, 2023।  [13] वेनकी झांग, योंगलियांग शेन, वीमिंग लू और यूटिंग झुआंग। डेटा-कोपायलट: स्वायत्त वर्कफ़्लो के साथ अरबों डेटा और मनुष्यों को जोड़ना, 2023।  यह पेपर   है। arxiv पर CC BY-NC-SA 4.0 DEED लाइसेंस के अंतर्गत उपलब्ध

Part of HackerNoon's growing list of open-source research papers, promoting free access to academic material.

FEW SHOT .tech

यह ऑडियो कहानी की मूल भाषा में निर्मित है!

एलएलएम का उपयोग करके स्वचालित उपग्रह चित्र कैप्शन निर्माण की ओर: संदर्भ

About Author

टिप्पणियाँ

लेबल

इस लेख में चित्रित किया गया था

Related Stories

HackerNoon लेखन प्रतियोगिता जीतना चाहते हैं? #crypto-api प्रतियोगिता के विजेताओं की सलाह यहाँ पढ़ें

HackerNoon एक बहुभाषी प्लेटफ़ॉर्म है: सभी शीर्ष कहानियाँ अब 13 भाषाओं में उपलब्ध हैं

अपने वर्कफ़्लो को 10 गुना बेहतर कैसे बनाएं: 17 ज़रूरी ऐप्स

He/Him/Master of Discovery

HackerNoon लेखन प्रतियोगिता जीतना चाहते हैं? #crypto-api प्रतियोगिता के विजेताओं की सलाह यहाँ पढ़ें

HackerNoon एक बहुभाषी प्लेटफ़ॉर्म है: सभी शीर्ष कहानियाँ अब 13 भाषाओं में उपलब्ध हैं

अपने वर्कफ़्लो को 10 गुना बेहतर कैसे बनाएं: 17 ज़रूरी ऐप्स

He/Him/Master of Discovery

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps