paint-brush
क्या एनवीडिया आरटीएक्स ए4000 एडीए मशीन लर्निंग कार्य संभाल सकता है?द्वारा@hostkey
3,096 रीडिंग
3,096 रीडिंग

क्या एनवीडिया आरटीएक्स ए4000 एडीए मशीन लर्निंग कार्य संभाल सकता है?

द्वारा Hostkey.com15m2023/06/29
Read on Terminal Reader

बहुत लंबा; पढ़ने के लिए

अप्रैल में, एनवीडिया ने एक नया उत्पाद, आरटीएक्स ए4000 एडीए लॉन्च किया, जो वर्कस्टेशन अनुप्रयोगों के लिए डिज़ाइन किया गया एक छोटा फॉर्म फैक्टर जीपीयू है। यह प्रोसेसर A2000 की जगह लेता है और इसका उपयोग वैज्ञानिक अनुसंधान, इंजीनियरिंग गणना और डेटा विज़ुअलाइज़ेशन सहित जटिल कार्यों के लिए किया जा सकता है। नए GPU की 20GB मेमोरी क्षमता इसे बड़े वातावरण को संभालने में सक्षम बनाती है।
featured image - क्या एनवीडिया आरटीएक्स ए4000 एडीए मशीन लर्निंग कार्य संभाल सकता है?
Hostkey.com HackerNoon profile picture
0-item

अप्रैल में, एनवीडिया ने एक नया उत्पाद, आरटीएक्स ए4000 एडीए लॉन्च किया, जो वर्कस्टेशन अनुप्रयोगों के लिए डिज़ाइन किया गया एक छोटा फॉर्म फैक्टर जीपीयू है। यह प्रोसेसर A2000 की जगह लेता है और इसका उपयोग वैज्ञानिक अनुसंधान, इंजीनियरिंग गणना और डेटा विज़ुअलाइज़ेशन सहित जटिल कार्यों के लिए किया जा सकता है।


RTX A4000 ADA में 6,144 CUDA कोर, 192 Tensor और 48 RT कोर और 20GB GDDR6 ECC VRAM है। नए GPU का एक प्रमुख लाभ इसकी बिजली दक्षता है: RTX A4000 ADA केवल 70W की खपत करता है, जो बिजली की लागत और सिस्टम गर्मी दोनों को कम करता है। GPU आपको इसकी 4x मिनी-डिस्प्लेपोर्ट 1.4a कनेक्टिविटी की बदौलत कई डिस्प्ले चलाने की भी अनुमति देता है।





RTX 4000 SFF ADA GPU की समान श्रेणी के अन्य उपकरणों से तुलना करते समय, यह ध्यान दिया जाना चाहिए कि एकल परिशुद्धता मोड में चलने पर, यह नवीनतम पीढ़ी के RTX A4000 GPU के समान प्रदर्शन दिखाता है, जो दोगुनी बिजली (140W बनाम) की खपत करता है। 70W).





ADA RTX 4000 SFF ADA लवलेस आर्किटेक्चर और 5nm प्रोसेस टेक्नोलॉजी पर बनाया गया है। यह अगली पीढ़ी के टेन्सर कोर और रे ट्रेसिंग कोर को सक्षम बनाता है, जो आरटीएक्स ए4000 की तुलना में तेज और अधिक कुशल रे ट्रेसिंग और टेन्सर कोर प्रदान करके प्रदर्शन में काफी सुधार करता है। इसके अलावा, एडीए का आरटीएक्स 4000 एसएफएफ एक छोटे पैकेज में आता है - कार्ड 168 मिमी लंबा और दो विस्तार स्लॉट जितना मोटा है।





बेहतर किरण अनुरेखण कर्नेल उन वातावरणों में कुशल प्रदर्शन की अनुमति देता है जहां प्रौद्योगिकी का उपयोग किया जाता है, जैसे कि 3डी डिजाइन और रेंडरिंग में। इसके अलावा, नए GPU की 20GB मेमोरी क्षमता इसे बड़े वातावरण को संभालने में सक्षम बनाती है।





निर्माता के अनुसार, चौथी पीढ़ी के टेन्सर कोर उच्च एआई कम्प्यूटेशनल प्रदर्शन प्रदान करते हैं - पिछली पीढ़ी की तुलना में प्रदर्शन में दोगुनी वृद्धि। नए Tensor कोर FP8 त्वरण का समर्थन करते हैं। यह नवोन्मेषी सुविधा जीनोमिक्स और कंप्यूटर विज़न जैसे वातावरण में एआई मॉडल विकसित करने और तैनात करने वालों के लिए अच्छा काम कर सकती है।


यह भी ध्यान देने योग्य बात है कि एन्कोडिंग और डिकोडिंग तंत्र में वृद्धि आरटीएक्स 4000 एसएफएफ एडीए को वीडियो जैसे मल्टीमीडिया वर्कलोड के लिए एक अच्छा समाधान बनाती है।



NVIDIA RTX A4000 और RTX A5000 ग्राफ़िक्स कार्ड, RTX 3090 की तकनीकी विशिष्टताएँ


आरटीएक्स ए4000 एडीए

एनवीडिया आरटीएक्स ए4000

एनवीडिया आरटीएक्स ए5000

आरटीएक्स 3090

वास्तुकला

एडा लवलेस

एम्पेयर

एम्पेयर

एम्पेयर

तकनीकी प्रक्रिया

5 एनएम

8 एनएम

8 एनएम

8 एनएम

जीपीयू

एडी104

GA102

GA104

GA102

ट्रांजिस्टर की संख्या (लाखों)

35,800

17,400

28,300

28,300

मेमोरी बैंडविड्थ (जीबी/एस)

280.0

448

768

936.2

वीडियो मेमोरी क्षमता (बिट्स)

160

256

384

384

जीपीयू मेमोरी (जीबी)

20

16

24

24

मेमोरी प्रकार

जीडीडीआर6

जीडीडीआर6

जीडीडीआर6

GDDR6X

CUDA कोर

6,144

6 144

8192

10496

टेंसर कोर

192

192

256

328

आरटी कोर

48

48

64

82

एसपी पर्फ (टेराफ्लॉप्स)

19.2

19,2

27,8

35,6

आरटी कोर प्रदर्शन (टेराफ्लॉप्स)

44.3

37,4

54,2

69,5

टेंसर प्रदर्शन (टेराफ्लॉप्स)

306.8

153,4

222,2

285

अधिकतम शक्ति (वाट)

70

140

230

350

इंटरफेस

पीसीआईई 4.0 x 16

पीसीआई-ई 4.0 x16

पीसीआई-ई 4.0 x16

पीसीआईई 4.0 x16

कनेक्टर्स

4x मिनी डिस्प्लेपोर्ट 1.4ए

डीपी 1.4 (4)

डीपी 1.4 (4)

डीपी 1.4 (4)

बनाने का कारक

2 स्लॉट

1 स्लॉट

2 स्लॉट

2-3 स्लॉट

वीजीपीयू सॉफ्टवेयर

नहीं

नहीं

हाँ, असीमित

हाँ। सीमाओं के साथ

एनवीलिंक

नहीं

नहीं

2x आरटीएक्स ए5000

हाँ

सीयूडीए समर्थन

11.6

8.6

8.6

8.6

वल्कन समर्थन

1.3

हाँ

हाँ

हाँ, 1.2

मूल्य (USD)

1,250

1000

2500

1400



परीक्षण वातावरण का विवरण


आरटीएक्स ए4000 एडीए

आरटीएक्स ए4000

CPU

AMD Ryzen 9 5950X 3.4GHz (16 कोर)

ऑक्टाकोर इंटेल झियोन ई-2288जी, 3.5 गीगाहर्ट्ज़

टक्कर मारना

4x 32 जीबी डीडीआर4 ईसीसी एसओ-डीआईएमएम

2x 32 जीबी डीडीआर4-3200 ईसीसी डीडीआर4 एसडीआरएएम 1600 मेगाहर्ट्ज

गाड़ी चलाना

1टीबी एनवीएमई एसएसडी

सैमसंग एसएसडी 980 प्रो 1टीबी

मदरबोर्ड

ASRock X570D4I-2T

आसुस P11C-I सीरीज

ऑपरेटिंग सिस्टम

माइक्रोसॉफ्ट विंडोज 10

माइक्रोसॉफ्ट विंडोज 10



परीक्षा के परिणाम


वी-रे 5 बेंचमार्क

अंक अर्जित किये गये


अंक अर्जित किये गये


वी-रे जीपीयू सीयूडीए और आरटीएक्स परीक्षण सापेक्ष जीपीयू रेंडरिंग प्रदर्शन को मापते हैं। RTX A4000 GPU, RTX A4000 ADA (क्रमशः 4% और 11%) से थोड़ा पीछे है।


यंत्र अधिगम


"कुत्ते बनाम बिल्लियाँ"

तंत्रिका नेटवर्क के लिए जीपीयू के प्रदर्शन की तुलना करने के लिए, हमने "कुत्ते बनाम बिल्लियाँ" डेटासेट का उपयोग किया - परीक्षण एक तस्वीर की सामग्री का विश्लेषण करता है और यह पहचानता है कि तस्वीर में बिल्ली या कुत्ता दिखाई दे रहा है या नहीं। सभी आवश्यक कच्चा डेटा पाया जा सकता है यहाँ . हमने यह परीक्षण विभिन्न जीपीयू और क्लाउड सेवाओं पर चलाया और निम्नलिखित परिणाम प्राप्त किए:


इस परीक्षण में, RTX A4000 ADA ने RTX A4000 से 9% बेहतर प्रदर्शन किया, लेकिन नए GPU के छोटे आकार और कम बिजली खपत को ध्यान में रखें।



एआई-बेंचमार्क


एआई-बेंचमार्क आपको एआई मॉडल आउटपुट कार्य के दौरान डिवाइस के प्रदर्शन को मापने की अनुमति देता है। माप की इकाई परीक्षण के अनुसार भिन्न हो सकती है, लेकिन आमतौर पर यह प्रति सेकंड संचालन की संख्या (ओपीएस) या फ्रेम प्रति सेकंड (एफपीएस) की संख्या होती है।


अंक अर्जित किये गये




आरटीएक्स ए4000

आरटीएक्स ए4000 एडीए

1/19. मोबाइलनेट-V2

1.1 - अनुमान | बैच=50, आकार=224x224: 38.5 ± 2.4 एमएस1.2 — प्रशिक्षण | बैच=50, आकार=224x224: 109 ± 4 एमएस

1.1 - अनुमान | बैच=50, आकार=224x224: 53.5 ± 0.7 एमएस1.2 — प्रशिक्षण | बैच=50, आकार=224x224: 130.1 ± 0.6 एमएस

2/19. आरंभ-V3

2.1 - अनुमान | बैच=20, आकार=346x346: 36.1 ± 1.8 एमएस2.2 — प्रशिक्षण | बैच=20, आकार=346x346: 137.4 ± 0.6 एमएस

2.1 - अनुमान | बैच=20, आकार=346x346: 36.8 ± 1.1 एमएस2.2 — प्रशिक्षण | बैच=20, आकार=346x346: 147.5 ± 0.8 एमएस

3/19. आरंभ-V4

3.1 - अनुमान | बैच=10, आकार=346x346: 34.0 ± 0.9 एमएस3.2 — प्रशिक्षण | बैच=10, आकार=346x346: 139.4 ± 1.0 एमएस

3.1 - अनुमान | बैच=10, आकार=346x346: 33.0 ± 0.8 एमएस3.2 — प्रशिक्षण | बैच=10, आकार=346x346: 135.7 ± 0.9 एमएस

4/19. इंसेप्शन-रेसनेट-V2

4.1 - अनुमान | बैच=10, आकार=346x346: 45.7 ± 0.6 एमएस4.2 — प्रशिक्षण | बैच=8, आकार=346x346: 153.4 ± 0.8 एमएस

4.1 - अनुमान बैच = 10, आकार = 346x346: 33.6 ± 0.7 एमएस4.2 - प्रशिक्षण बैच = 8, आकार = 346x346: 132 ± 1 एमएस

5/19. रेसनेट-V2-50

5.1 — अनुमान | बैच=10, आकार=346x346: 25.3 ± 0.5 एमएस5.2 — प्रशिक्षण | बैच=10, आकार=346x346: 91.1 ± 0.8 एमएस

5.1 — अनुमान | बैच=10, आकार=346x346: 26.1 ± 0.5 एमएस5.2 — प्रशिक्षण | बैच=10, आकार=346x346: 92.3 ± 0.6 एमएस

6/19. रेसनेट-V2-152

6.1 - अनुमान | बैच=10, आकार=256x256: 32.4 ± 0.5 एमएस6.2 — प्रशिक्षण | बैच=10, आकार=256x256: 131.4 ± 0.7 एमएस

6.1 - अनुमान | बैच=10, आकार=256x256: 23.7 ± 0.6 एमएस6.2 — प्रशिक्षण | बैच=10, आकार=256x256: 107.1 ± 0.9 एमएस

7/19. वीजीजी-16

7.1 — अनुमान | बैच=20, आकार=224x224: 54.9 ± 0.9 एमएस7.2 — प्रशिक्षण | बैच=2, आकार=224x224: 83.6 ± 0.7 एमएस

7.1 — अनुमान | बैच=20, आकार=224x224: 66.3 ± 0.9 एमएस7.2 — प्रशिक्षण | बैच=2, आकार=224x224: 109.3 ± 0.8 एमएस

8/19. एसआरसीएनएन 9-5-5

8.1 — अनुमान | बैच=10, आकार=512x512: 51.5 ± 0.9 एमएस8.2 — अनुमान | बैच=1, आकार=1536x1536: 45.7 ± 0.9 एमएस8.3 — प्रशिक्षण | बैच=10, आकार=512x512: 183 ± 1 एमएस

8.1 — अनुमान | बैच=10, आकार=512x512: 59.9 ± 1.6 एमएस8.2 — अनुमान | बैच=1, आकार=1536x1536: 53.1 ± 0.7 एमएस8.3 — प्रशिक्षण | बैच=10, आकार=512x512: 176 ± 2 एमएस

9/19. वीजीजी-19 सुपर-रेस

9.1 - अनुमान | बैच=10, आकार=256x256: 99.5 ± 0.8 एमएस9.2 — अनुमान | बैच=1, आकार=1024x1024: 162 ± 1 एमएस9.3 — प्रशिक्षण | बैच=10, आकार=224x224: 204 ± 2 एमएस


10/19. रेसनेट-एसआरजीएएन

10.1 — अनुमान | बैच=10, आकार=512x512: 85.8 ± 0.6 एमएस10.2 — अनुमान | बैच=1, आकार=1536x1536: 82.4 ± 1.9 एमएस10.3 — प्रशिक्षण | बैच=5, आकार=512x512: 133 ± 1 एमएस

10.1 — अनुमान | बैच=10, आकार=512x512: 98.9 ± 0.8 एमएस10.2 — अनुमान | बैच=1, आकार=1536x1536: 86.1 ± 0.6 एमएस10.3 — प्रशिक्षण | बैच=5, आकार=512x512: 130.9 ± 0.6 एमएस

11/19. रेसनेट-डीपीईडी

11.1 — अनुमान | बैच=10, आकार=256x256: 114.9 ± 0.6 एमएस11.2 — अनुमान | बैच=1, आकार=1024x1024: 182 ± 2 एमएस11.3 — प्रशिक्षण | बैच=15, आकार=128x128: 178.1 ± 0.8 एमएस

11.1 — अनुमान | बैच=10, आकार=256x256: 146.4 ± 0.5 एमएस11.2 — अनुमान | बैच=1, आकार=1024x1024: 234.3 ± 0.5 एमएस11.3 — प्रशिक्षण | बैच=15, आकार=128x128: 234.7 ± 0.6 एमएस

12/19. यू-नेट

12.1 — अनुमान | बैच=4, आकार=512x512: 180.8 ± 0.7 एमएस12.2 — अनुमान | बैच=1, आकार=1024x1024: 177.0 ± 0.4 एमएस12.3 — प्रशिक्षण | बैच=4, आकार=256x256: 198.6 ± 0.5 एमएस

12.1 — अनुमान | बैच=4, आकार=512x512: 222.9 ± 0.5 एमएस12.2 — अनुमान | बैच=1, आकार=1024x1024: 220.4 ± 0.6 एमएस12.3 — प्रशिक्षण | बैच=4, आकार=256x256: 229.1 ± 0.7 एमएस

13/19. एनवीडिया-स्पेड

13.1 — अनुमान | बैच=5, आकार=128x128: 54.5 ± 0.5 एमएस13.2 — प्रशिक्षण | बैच=1, आकार=128x128: 103.6 ± 0.6 एमएस

13.1 — अनुमान | बैच=5, आकार=128x128: 59.6 ± 0.6 एमएस13.2 — प्रशिक्षण | बैच=1, आकार=128x128: 94.6 ± 0.6 एमएस

14/19. आईसीनेट

14.1 — अनुमान | बैच=5, आकार=1024x1536: 126.3 ± 0.8 एमएस14.2 — प्रशिक्षण | बैच=10, आकार=1024x1536: 426 ± 9 एमएस

14.1 — अनुमान | बैच=5, आकार=1024x1536: 144 ± 4 एमएस14.2 — प्रशिक्षण | बैच=10, आकार=1024x1536: 475 ± 17 एमएस

15/19. पीएसपीनेट

15.1 — अनुमान | बैच=5, आकार=720x720: 249 ± 12 एमएस15.2 — प्रशिक्षण | बैच=1, आकार=512x512: 104.6 ± 0.6 एमएस

15.1 — अनुमान | बैच=5, आकार=720x720: 291.4 ± 0.5 एमएस15.2 — प्रशिक्षण | बैच=1, आकार=512x512: 99.8 ± 0.9 एमएस

16/19. डीपलैब

16.1 — अनुमान | बैच=2, आकार=512x512: 71.7 ± 0.6 एमएस16.2 — प्रशिक्षण | बैच=1, आकार=384x384: 84.9 ± 0.5 एमएस

16.1 — अनुमान | बैच=2, आकार=512x512: 71.5 ± 0.7 एमएस16.2 — प्रशिक्षण | बैच=1, आकार=384x384: 69.4 ± 0.6 एमएस

17/19. पिक्सेल-आरएनएन

17.1 — अनुमान | बैच=50, आकार=64x64: 299 ± 14 एमएस17.2 — प्रशिक्षण | बैच=10, आकार=64x64: 1258 ± 64 एमएस

17.1 — अनुमान | बैच=50, आकार=64x64: 321 ± 30 एमएस17.2 — प्रशिक्षण | बैच=10, आकार=64x64: 1278 ± 74 एमएस

18/19. LSTM-भावना

18.1 — अनुमान | बैच=100, आकार=1024x300: 395 ± 11 एमएस18.2 — प्रशिक्षण | बैच=10, आकार=1024x300: 676 ± 15 एमएस

18.1 — अनुमान | बैच=100, आकार=1024x300: 345 ± 10 एमएस18.2 — प्रशिक्षण | बैच=10, आकार=1024x300: 774 ± 17 एमएस

19/19. जीएनएमटी-अनुवाद

19.1 — अनुमान | बैच=1, आकार=1x20: 119 ± 2 एमएस

19.1 — अनुमान | बैच=1, आकार=1x20: 156 ± 1 एमएस


इस परीक्षण के नतीजे बताते हैं कि आरटीएक्स ए4000 का प्रदर्शन आरटीएक्स ए4000 एडीए से 6% अधिक है, हालांकि, इस चेतावनी के साथ कि परीक्षण के परिणाम नियोजित विशिष्ट कार्य और परिचालन स्थितियों के आधार पर भिन्न हो सकते हैं।


पायटोरच


आरटीएक्स ए 4000

बेंच मार्किंग

मॉडल औसत ट्रेन समय (एमएस)

प्रशिक्षण डबल परिशुद्धता प्रकार mnasnet0_5

62.995805740356445

प्रशिक्षण डबल परिशुद्धता प्रकार mnasnet0_75

98.39066505432129

प्रशिक्षण डबल परिशुद्धता प्रकार mnasnet1_0

126.60405158996582

प्रशिक्षण डबल परिशुद्धता प्रकार mnasnet1_3

186.89460277557373

प्रशिक्षण डबल परिशुद्धता प्रकार resnet18

428.08079719543457

प्रशिक्षण डबल परिशुद्धता प्रकार resnet34

883.5790348052979

प्रशिक्षण डबल परिशुद्धता प्रकार resnet50

1016.3950300216675

प्रशिक्षण डबल परिशुद्धता प्रकार resnet101

1927.2308254241943

प्रशिक्षण डबल परिशुद्धता प्रकार resnet152

2815.663013458252

प्रशिक्षण डबल परिशुद्धता प्रकार resnext50_32x4d

1075.4373741149902

प्रशिक्षण डबल परिशुद्धता प्रकार resnext101_32x8d

4050.0641918182373

प्रशिक्षण डबल प्रिसिजन टाइप वाइड_रेसनेट50_2

2615.9953451156616

प्रशिक्षण डबल प्रिसिजन टाइप वाइड_रेसनेट101_2

5218.524832725525

प्रशिक्षण डबल परिशुद्धता प्रकार Densnet121

751.9759511947632

प्रशिक्षण डबल प्रिसिजन टाइप डेंसनेट169

910.3225564956665

प्रशिक्षण डबल परिशुद्धता प्रकार Densnet201

1163.036551475525

प्रशिक्षण डबल प्रिसिजन टाइप डेंसनेट161

2141.505298614502

प्रशिक्षण डबल प्रिसिजन टाइप स्क्वीज़नेट1_0

203.14435005187988

प्रशिक्षण डबल प्रिसिजन टाइप स्क्वीज़नेट1_1

98.04857730865479

प्रशिक्षण डबल परिशुद्धता प्रकार vgg11

1697.710485458374

प्रशिक्षण डबल परिशुद्धता प्रकार vgg11_bn

1729.2972660064697

प्रशिक्षण डबल परिशुद्धता प्रकार vgg13

2491.615080833435

प्रशिक्षण डबल परिशुद्धता प्रकार vgg13_bn

2545.1631927490234

प्रशिक्षण डबल परिशुद्धता प्रकार vgg16

3371.1953449249268

प्रशिक्षण डबल परिशुद्धता प्रकार vgg16_bn

3423.8639068603516

प्रशिक्षण डबल परिशुद्धता प्रकार vgg19_bn

4314.5153522491455

प्रशिक्षण डबल परिशुद्धता प्रकार vgg19

4249.422650337219

प्रशिक्षण डबल परिशुद्धता प्रकार mobilenet_v3_large

105.54619789123535

प्रशिक्षण डबल परिशुद्धता प्रकार mobilenet_v3_small

37.6680850982666

प्रशिक्षण डबल परिशुद्धता प्रकार शफ़लनेट_v2_x0_5

26.51611328125

प्रशिक्षण डबल परिशुद्धता प्रकार शफ़लनेट_v2_x1_0

61.260504722595215

प्रशिक्षण डबल परिशुद्धता प्रकार शफ़लनेट_v2_x1_5

105.30067920684814

प्रशिक्षण डबल परिशुद्धता प्रकार शफ़लनेट_v2_x2_0

181.03694438934326

अनुमान डबल परिशुद्धता प्रकार mnasnet0_5

17.397074699401855

अनुमान डबल परिशुद्धता प्रकार mnasnet0_75

28.902697563171387

अनुमान डबल परिशुद्धता प्रकार mnasnet1_0

38.387718200683594

अनुमान डबल परिशुद्धता प्रकार mnasnet1_3

58.228821754455566

अनुमान डबल परिशुद्धता प्रकार resnet18

147.95727252960205

अनुमान डबल परिशुद्धता प्रकार resnet34

293.519492149353

अनुमान डबल परिशुद्धता प्रकार resnet50

336.44991874694824

अनुमान डबल परिशुद्धता प्रकार resnet101

637.9982376098633

अनुमान डबल परिशुद्धता प्रकार resnet152

948.9351654052734

अनुमान डबल परिशुद्धता प्रकार resnext50_32x4d

372.80876636505127

अनुमान डबल परिशुद्धता प्रकार resnext101_32x8d

1385.1624917984009

अनुमान डबल परिशुद्धता प्रकार width_resnet50_2

873.048791885376

अनुमान डबल परिशुद्धता प्रकार width_resnet101_2

1729.2765426635742

अनुमान डबल परिशुद्धता प्रकार Densnet121

270.13323307037354

अनुमान डबल परिशुद्धता प्रकार डेंसनेट169

327.1932888031006

अनुमान डबल परिशुद्धता प्रकार Densnet201

414.733362197876

अनुमान डबल परिशुद्धता प्रकार डेंसनेट161

766.3542318344116

अनुमान डबल परिशुद्धता प्रकार स्क्वीज़नेट1_0

74.86292839050293

अनुमान डबल प्रिसिजन प्रकार स्क्वीज़नेट1_1

34.04905319213867

अनुमान डबल परिशुद्धता प्रकार vgg11

576.3767147064209

अनुमान डबल परिशुद्धता प्रकार vgg11_bn

580.5839586257935

अनुमान डबल परिशुद्धता प्रकार vgg13

853.4365510940552

अनुमान डबल परिशुद्धता प्रकार vgg13_bn

860.3136301040649

अनुमान डबल परिशुद्धता प्रकार vgg16

1145.091052055359

अनुमान डबल परिशुद्धता प्रकार vgg16_bn

1152.8028392791748

अनुमान डबल परिशुद्धता प्रकार vgg19_bn

1444.9562692642212

अनुमान डबल परिशुद्धता प्रकार vgg19

1437.0987701416016

अनुमान डबल परिशुद्धता प्रकार mobilenet_v3_large

30.876317024230957

अनुमान डबल परिशुद्धता प्रकार mobilenet_v3_small

11.234536170959473

अनुमान डबल परिशुद्धता प्रकार shufflenet_v2_x0_5

7.425284385681152

अनुमान डबल परिशुद्धता प्रकार shufflenet_v2_x1_0

18.25782299041748

अनुमान डबल परिशुद्धता प्रकार shufflenet_v2_x1_5

33.34946632385254

अनुमान डबल परिशुद्धता प्रकार shufflenet_v2_x2_0

57.84676551818848


आरटीएक्स ए4000 एडीए


बेंच मार्किंग

मॉडल औसत ट्रेन समय

प्रशिक्षण आधा परिशुद्धता प्रकार mnasnet0_5

20.266618728637695

प्रशिक्षण आधा परिशुद्धता प्रकार mnasnet0_75

21.445374488830566

प्रशिक्षण आधा परिशुद्धता प्रकार mnasnet1_0

26.714019775390625

प्रशिक्षण आधा परिशुद्धता प्रकार mnasnet1_3

26.5126371383667

प्रशिक्षण आधा परिशुद्धता प्रकार resnet18

19.624991416931152

प्रशिक्षण आधा परिशुद्धता प्रकार resnet34

32.46446132659912

प्रशिक्षण आधा परिशुद्धता प्रकार resnet50

57.17473030090332

प्रशिक्षण आधा परिशुद्धता प्रकार resnet101

98.20127010345459

प्रशिक्षण आधा परिशुद्धता प्रकार resnet152

138.18389415740967

प्रशिक्षण आधा परिशुद्धता प्रकार resnext50_32x4d

75.56005001068115

प्रशिक्षण आधा परिशुद्धता प्रकार resnext101_32x8d

228.8706636428833

प्रशिक्षण अर्ध परिशुद्धता प्रकार वाइड_रेसनेट50_2

113.76442432403564

प्रशिक्षण अर्ध परिशुद्धता प्रकार वाइड_रेसनेट101_2

204.17311191558838

प्रशिक्षण आधा परिशुद्धता प्रकार Densnet121

68.97401332855225

प्रशिक्षण अर्ध परिशुद्धता प्रकार डेंसनेट169

85.16453742980957

प्रशिक्षण आधा परिशुद्धता प्रकार Densnet201

103.299241065979

प्रशिक्षण अर्ध परिशुद्धता प्रकार डेंसनेट161

137.54578113555908

प्रशिक्षण अर्ध परिशुद्धता प्रकार स्क्वीज़नेट1_0

16.71830177307129

प्रशिक्षण अर्ध परिशुद्धता प्रकार स्क्वीज़नेट1_1

12.906527519226074

प्रशिक्षण आधा परिशुद्धता प्रकार vgg11

51.7004919052124

प्रशिक्षण आधा परिशुद्धता प्रकार vgg11_bn

57.63327598571777

प्रशिक्षण आधा परिशुद्धता प्रकार vgg13

86.10869407653809

प्रशिक्षण आधा परिशुद्धता प्रकार vgg13_bn

95.86676120758057

प्रशिक्षण आधा परिशुद्धता प्रकार vgg16

102.91589260101318

प्रशिक्षण आधा परिशुद्धता प्रकार vgg16_bn

113.74778270721436

प्रशिक्षण आधा परिशुद्धता प्रकार vgg19_bn

131.56734943389893

प्रशिक्षण आधा परिशुद्धता प्रकार vgg19

119.70191955566406

प्रशिक्षण आधा परिशुद्धता प्रकार mobilenet_v3_large

31.30636692047119

प्रशिक्षण आधा परिशुद्धता प्रकार mobilenet_v3_small

19.44464683532715

प्रशिक्षण अर्ध परिशुद्धता प्रकार शफ़लनेट_v2_x0_5

13.710575103759766

प्रशिक्षण अर्ध परिशुद्धता प्रकार शफ़लनेट_v2_x1_0

23.608479499816895

प्रशिक्षण अर्ध परिशुद्धता प्रकार शफ़लनेट_v2_x1_5

26.793746948242188

प्रशिक्षण अर्ध परिशुद्धता प्रकार शफ़लनेट_v2_x2_0

24.550962448120117

अनुमान आधा परिशुद्धता प्रकार mnasnet0_5

4.418272972106934

अनुमान आधा परिशुद्धता प्रकार mnasnet0_75

4.021778106689453

अनुमान आधा परिशुद्धता प्रकार mnasnet1_0

4.42598819732666

अनुमान आधा परिशुद्धता प्रकार mnasnet1_3

4.618926048278809

अनुमान आधा परिशुद्धता प्रकार resnet18

5.803341865539551

अनुमान आधा परिशुद्धता प्रकार resnet34

9.756693840026855

अनुमान आधा परिशुद्धता प्रकार resnet50

15.873079299926758

अनुमान आधा परिशुद्धता प्रकार resnet101

28.268003463745117

अनुमान आधा परिशुद्धता प्रकार resnet152

40.04594326019287

अनुमान आधा परिशुद्धता प्रकार resnext50_32x4d

19.53421115875244

अनुमान आधा परिशुद्धता प्रकार resnext101_32x8d

62.44826316833496

अनुमान आधा परिशुद्धता प्रकार width_resnet50_2

33.533992767333984

अनुमान आधा परिशुद्धता प्रकार width_resnet101_2

59.60897445678711

अनुमान आधा परिशुद्धता प्रकार Densnet121

18.052735328674316

अनुमान आधा परिशुद्धता प्रकार Densnet169

21.956982612609863

अनुमान आधा परिशुद्धता प्रकार Densnet201

27.85182476043701

अनुमान आधा परिशुद्धता प्रकार डेंसनेट161

37.41891860961914

अनुमान आधा परिशुद्धता प्रकार स्क्वीज़नेट1_0

4.391803741455078

अनुमान आधा परिशुद्धता प्रकार स्क्वीज़नेट1_1

2.4281740188598633

अनुमान आधा परिशुद्धता प्रकार vgg11

17.11493968963623

अनुमान आधा परिशुद्धता प्रकार vgg11_bn

18.40585231781006

अनुमान आधा परिशुद्धता प्रकार vgg13

28.438148498535156

अनुमान आधा परिशुद्धता प्रकार vgg13_bn

30.672597885131836

अनुमान आधा परिशुद्धता प्रकार vgg16

34.43562984466553

अनुमान आधा परिशुद्धता प्रकार vgg16_bn

36.92122936248779

अनुमान आधा परिशुद्धता प्रकार vgg19_bn

43.144264221191406

अनुमान आधा परिशुद्धता प्रकार vgg19

40.5385684967041

अनुमान आधा परिशुद्धता प्रकार mobilenet_v3_large

5.350713729858398

अनुमान आधा परिशुद्धता प्रकार mobilenet_v3_small

4.016985893249512

अनुमान आधा परिशुद्धता प्रकार shufflenet_v2_x0_5

5.079126358032227

अनुमान आधा परिशुद्धता प्रकार shufflenet_v2_x1_0

5.593156814575195

अनुमान आधा परिशुद्धता प्रकार shufflenet_v2_x1_5

5.649552345275879

अनुमान आधा परिशुद्धता प्रकार shufflenet_v2_x2_0

5.355663299560547

प्रशिक्षण डबल परिशुद्धता प्रकार mnasnet0_5

50.2386999130249

प्रशिक्षण डबल परिशुद्धता प्रकार mnasnet0_75

80.66896915435791

प्रशिक्षण डबल परिशुद्धता प्रकार mnasnet1_0

103.32422733306885

प्रशिक्षण डबल परिशुद्धता प्रकार mnasnet1_3

154.6230697631836

प्रशिक्षण डबल परिशुद्धता प्रकार resnet18

337.94031620025635

प्रशिक्षण डबल परिशुद्धता प्रकार resnet34

677.7706575393677

प्रशिक्षण डबल परिशुद्धता प्रकार resnet50

789.9243211746216

प्रशिक्षण डबल परिशुद्धता प्रकार resnet101

1484.3351316452026

प्रशिक्षण डबल परिशुद्धता प्रकार resnet152

2170.570478439331

प्रशिक्षण डबल परिशुद्धता प्रकार resnext50_32x4d

877.3719882965088

प्रशिक्षण डबल परिशुद्धता प्रकार resnext101_32x8d

3652.4944639205933

प्रशिक्षण डबल प्रिसिजन टाइप वाइड_रेसनेट50_2

2154.612874984741

प्रशिक्षण डबल प्रिसिजन टाइप वाइड_रेसनेट101_2

4176.522083282471

प्रशिक्षण डबल परिशुद्धता प्रकार Densnet121

607.8699731826782

प्रशिक्षण डबल प्रिसिजन टाइप डेंसनेट169

744.6409797668457

प्रशिक्षण डबल परिशुद्धता प्रकार Densnet201

962.677731513977

प्रशिक्षण डबल प्रिसिजन टाइप डेंसनेट161

1759.772515296936

प्रशिक्षण डबल प्रिसिजन टाइप स्क्वीज़नेट1_0

164.3690824508667

प्रशिक्षण डबल प्रिसिजन टाइप स्क्वीज़नेट1_1

78.70647430419922

प्रशिक्षण डबल परिशुद्धता प्रकार vgg11

1362.6095294952393

प्रशिक्षण डबल परिशुद्धता प्रकार vgg11_bn

1387.2539138793945

प्रशिक्षण डबल परिशुद्धता प्रकार vgg13

2006.0230445861816

प्रशिक्षण डबल परिशुद्धता प्रकार vgg13_bn

2047.526364326477

प्रशिक्षण डबल परिशुद्धता प्रकार vgg16

2702.2086429595947

प्रशिक्षण डबल परिशुद्धता प्रकार vgg16_bn

2747.241234779358

प्रशिक्षण डबल परिशुद्धता प्रकार vgg19_bn

3447.1724700927734

प्रशिक्षण डबल परिशुद्धता प्रकार vgg19

3397.990345954895

प्रशिक्षण डबल परिशुद्धता प्रकार mobilenet_v3_large

84.65698719024658

प्रशिक्षण डबल परिशुद्धता प्रकार mobilenet_v3_small

29.816465377807617

प्रशिक्षण डबल परिशुद्धता प्रकार शफ़लनेट_v2_x0_5

27.401342391967773

प्रशिक्षण डबल परिशुद्धता प्रकार शफ़लनेट_v2_x1_0

48.322744369506836

प्रशिक्षण डबल परिशुद्धता प्रकार शफ़लनेट_v2_x1_5

82.22103118896484

प्रशिक्षण डबल परिशुद्धता प्रकार शफ़लनेट_v2_x2_0

141.7021369934082

अनुमान डबल परिशुद्धता प्रकार mnasnet0_5

12.988653182983398

अनुमान डबल परिशुद्धता प्रकार mnasnet0_75

22.422199249267578

अनुमान डबल परिशुद्धता प्रकार mnasnet1_0

30.056486129760742

अनुमान डबल परिशुद्धता प्रकार mnasnet1_3

46.953935623168945

अनुमान डबल परिशुद्धता प्रकार resnet18

118.04479122161865

अनुमान डबल परिशुद्धता प्रकार resnet34

231.52336597442627

अनुमान डबल परिशुद्धता प्रकार resnet50

268.63497734069824

अनुमान डबल परिशुद्धता प्रकार resnet101

495.2010440826416

अनुमान डबल परिशुद्धता प्रकार resnet152

726.4922094345093

अनुमान डबल परिशुद्धता प्रकार resnext50_32x4d

291.47679328918457

अनुमान डबल परिशुद्धता प्रकार resnext101_32x8d

1055.10901927948

अनुमान डबल परिशुद्धता प्रकार width_resnet50_2

690.6917667388916

अनुमान डबल परिशुद्धता प्रकार width_resnet101_2

1347.5529861450195

अनुमान डबल परिशुद्धता प्रकार Densnet121

224.35829639434814

अनुमान डबल परिशुद्धता प्रकार डेंसनेट169

268.9145278930664

अनुमान डबल परिशुद्धता प्रकार Densnet201

343.1972026824951

अनुमान डबल परिशुद्धता प्रकार डेंसनेट161

635.866231918335

अनुमान डबल परिशुद्धता प्रकार स्क्वीज़नेट1_0

61.92759037017822

अनुमान डबल प्रिसिजन प्रकार स्क्वीज़नेट1_1

27.009410858154297

अनुमान डबल परिशुद्धता प्रकार vgg11

462.3375129699707

अनुमान डबल परिशुद्धता प्रकार vgg11_bn

468.4495782852173

अनुमान डबल परिशुद्धता प्रकार vgg13

692.8219032287598

अनुमान डबल परिशुद्धता प्रकार vgg13_bn

703.3538103103638

अनुमान डबल परिशुद्धता प्रकार vgg16

924.4353818893433

अनुमान डबल परिशुद्धता प्रकार vgg16_bn

936.5075063705444

अनुमान डबल परिशुद्धता प्रकार vgg19_bn

1169.098300933838

अनुमान डबल परिशुद्धता प्रकार vgg19

1156.3771772384644

अनुमान डबल परिशुद्धता प्रकार mobilenet_v3_large

24.2356014251709

अनुमान डबल परिशुद्धता प्रकार mobilenet_v3_small

8.85490894317627

अनुमान डबल परिशुद्धता प्रकार shufflenet_v2_x0_5

6.360034942626953

अनुमान डबल परिशुद्धता प्रकार shufflenet_v2_x1_0

14.301743507385254

अनुमान डबल परिशुद्धता प्रकार shufflenet_v2_x1_5

24.863481521606445

अनुमान डबल परिशुद्धता प्रकार shufflenet_v2_x2_0

43.8505744934082


निष्कर्ष

नया ग्राफ़िक्स कार्ड कई कार्य कार्यों के लिए एक प्रभावी समाधान साबित हुआ है। अपने कॉम्पैक्ट आकार के कारण, यह शक्तिशाली SFF (स्मॉल फॉर्म फैक्टर) कंप्यूटर के लिए आदर्श है। साथ ही, यह उल्लेखनीय है कि 160-बिट बस के साथ 6,144 CUDA कोर और 20GB मेमोरी इस कार्ड को बाज़ार में सबसे अधिक उत्पादक में से एक बनाती है। इसके अलावा, 70W का कम टीडीपी बिजली की खपत लागत को कम करने में मदद करता है। चार मिनी-डिस्प्लेपोर्ट पोर्ट कार्ड को कई मॉनिटरों के साथ या मल्टी-चैनल ग्राफिक्स समाधान के रूप में उपयोग करने की अनुमति देते हैं।


आरटीएक्स 4000 एसएफएफ एडीए पिछली पीढ़ियों की तुलना में एक महत्वपूर्ण प्रगति का प्रतिनिधित्व करता है, जो दोगुनी बिजली खपत वाले कार्ड के बराबर प्रदर्शन प्रदान करता है। बिना PCIe पावर कनेक्टर के, RTX 4000 SFF ADA को उच्च प्रदर्शन से समझौता किए बिना कम-पावर वर्कस्टेशन में एकीकृत करना आसान है।