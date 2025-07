எழுத்தாளர்கள் : (1) Vishaal Udandarao, Tubingen AI Center, University of Tubingen, University of Cambridge, மற்றும் அதே பங்கு; (2) Ameya Prabhu, Tubingen AI Center, University of Tubingen, University of Oxford, மற்றும் அதே சேவை; (3) Adhiraj Ghosh, Tubingen AI Center, University of Tubingen; (4) Yash Sharma, Tubingen AI Center, University of Tubingen; 5) Philip H.S. Torr, University of Oxford; (6) Adel Bibi, University of Oxford; (7) Samuel Albanie, University of Cambridge and equal counseling, order decided by a coin flip; எஸ்எம்எம்எம்எம் எஸ்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எம்எ (8) Matthias Bethge, Tubingen AI Center, University of Tubingen and equal advising, order decided by a coin flip.

Abstract மற்றும் 1 - Introduction

2 Pre-Training Data and Quantification Frequency பற்றிய கருத்துக்கள்

3 Pre-Training Frequency & “Zero-Shot” Performance மற்றும் 3.1 Experimental Setup ஒப்பிடும்

3.2 முடிவு: Pre-training Frequency is Predictive of “Zero-Shot” Performance

4 Stress-Testing the Concept Frequency-Performance Scaling Trend and 4.1 Controling for Similar Samples in Pre-Training and Downstream Data (முடிவமைப்பு மற்றும் கீழே உள்ள தரவுகளில் அதே மாதிரி ஆய்வுகள்)

4.2 Testing Generalization to Purely Synthetic Concept and Data Distributions (பொதுவாக ஒலிப்பதிவுகள் மற்றும் தரவு விவரங்கள்)

5 Pre-Training Concept Frequencies அறிமுகம்

6 Responses to “உணர்ச்சியைக் காட்டிக் கொள்ளுங்கள்!

7 தொடர்புடைய வேலைகள்

8 முடிவுகள் & Open Problems, Recognitions, and References

Part I

Appendix

A. Concept Frequency is Predictive of Performance Through Prompting Strategies (பொதுமொழி)

B. Concept Frequency is Predictive of Performance Across Retrieval Metrics என்பதன் அடிப்படையில்

C. Concept Frequency is Predictive of Performance for T2I மாதிரிகள்

D. Concept Frequency is Predictive of Performance across Concepts only from Image and Text Domains என்பதன் பொருள்

E. அறிவியல் விவரங்கள்

Q. ஏன் மற்றும் எப்படி நாம் RAM ++ பயன்படுத்துகிறோம்?

G. Misalignment Degree Results பற்றிய விவரங்கள்

H. T2I மாதிரிகள்: மதிப்பீடு

abstract செய்திகள்

1 அறிமுகம்

CLIP [91] and Stable Diffusion [96] have revolutionized performance on downstream tasks—CLIP is now the de-facto standard for “zero-shot” image recognition [133, 72, 126, 48, 132] and image text retrieval [46, 64, 24, 117, 129], while Stable Diffusion is now the de-facto standard for “zero-shot” text-to-image (T2I) generation [93, 17, 96, 41].இன்றைய multimodal மாதிரிகள் உண்மையில் “zero-shot” generalization செய்ய முடியுமா?





எங்கள் கண்காணிப்பில், நாங்கள் மேலும் pre-training data இல் சந்தித்த கருத்துக்களை வடிவமைக்க மற்றும் கண்டுபிடித்துள்ளோம்:





பல்வேறு முந்தைய ஆய்வுகள் [91, 46, 82, 42, 83, 74] செயல்திறனை பாதிக்கும் முன் பயிற்சி தரவுகளின் அம்சத்தை ஆய்வு செய்தன. Mayilvahanan et al. [79] CLIP's performance is correlated with the similarity between training and test datasets. In other studies on specific areas such as question-answering [62] and numerical reasoning [94] in large language models, high train-test set similarity did not fully account for observed performance levels [127]. எங்கள் முழுமையான ஆய்வு பல முன் பயிற்சி படங்கள்-text data sets significantly adds to this line of work, by (1) showing that concept frequency determines zero-shot performance and (2) pointing the exponential need for training data as a fundamental issue for current large-scale multimodal models. We conclude that the





இந்த பதிவு CC BY 4.0 DEED License கீழ் archiv இல் கிடைக்கிறது.

[1] class categories for classification tasks, objects in the text captions for retrieval tasks, and objects in the text prompts for generating tasks, see Section 2 for more details on how we define concepts.