अप्रैल में, एनवीडिया ने एक नया उत्पाद, आरटीएक्स ए4000 एडीए लॉन्च किया, जो वर्कस्टेशन अनुप्रयोगों के लिए डिज़ाइन किया गया एक छोटा फॉर्म फैक्टर जीपीयू है। यह प्रोसेसर A2000 की जगह लेता है और इसका उपयोग वैज्ञानिक अनुसंधान, इंजीनियरिंग गणना और डेटा विज़ुअलाइज़ेशन सहित जटिल कार्यों के लिए किया जा सकता है।
RTX A4000 ADA में 6,144 CUDA कोर, 192 Tensor और 48 RT कोर और 20GB GDDR6 ECC VRAM है। नए GPU का एक प्रमुख लाभ इसकी बिजली दक्षता है: RTX A4000 ADA केवल 70W की खपत करता है, जो बिजली की लागत और सिस्टम गर्मी दोनों को कम करता है। GPU आपको इसकी 4x मिनी-डिस्प्लेपोर्ट 1.4a कनेक्टिविटी की बदौलत कई डिस्प्ले चलाने की भी अनुमति देता है।
RTX 4000 SFF ADA GPU की समान श्रेणी के अन्य उपकरणों से तुलना करते समय, यह ध्यान दिया जाना चाहिए कि एकल परिशुद्धता मोड में चलने पर, यह नवीनतम पीढ़ी के RTX A4000 GPU के समान प्रदर्शन दिखाता है, जो दोगुनी बिजली (140W बनाम) की खपत करता है। 70W).
ADA RTX 4000 SFF ADA लवलेस आर्किटेक्चर और 5nm प्रोसेस टेक्नोलॉजी पर बनाया गया है। यह अगली पीढ़ी के टेन्सर कोर और रे ट्रेसिंग कोर को सक्षम बनाता है, जो आरटीएक्स ए4000 की तुलना में तेज और अधिक कुशल रे ट्रेसिंग और टेन्सर कोर प्रदान करके प्रदर्शन में काफी सुधार करता है। इसके अलावा, एडीए का आरटीएक्स 4000 एसएफएफ एक छोटे पैकेज में आता है - कार्ड 168 मिमी लंबा और दो विस्तार स्लॉट जितना मोटा है।
बेहतर किरण अनुरेखण कर्नेल उन वातावरणों में कुशल प्रदर्शन की अनुमति देता है जहां प्रौद्योगिकी का उपयोग किया जाता है, जैसे कि 3डी डिजाइन और रेंडरिंग में। इसके अलावा, नए GPU की 20GB मेमोरी क्षमता इसे बड़े वातावरण को संभालने में सक्षम बनाती है।
निर्माता के अनुसार, चौथी पीढ़ी के टेन्सर कोर उच्च एआई कम्प्यूटेशनल प्रदर्शन प्रदान करते हैं - पिछली पीढ़ी की तुलना में प्रदर्शन में दोगुनी वृद्धि। नए Tensor कोर FP8 त्वरण का समर्थन करते हैं। यह नवोन्मेषी सुविधा जीनोमिक्स और कंप्यूटर विज़न जैसे वातावरण में एआई मॉडल विकसित करने और तैनात करने वालों के लिए अच्छा काम कर सकती है।
यह भी ध्यान देने योग्य बात है कि एन्कोडिंग और डिकोडिंग तंत्र में वृद्धि आरटीएक्स 4000 एसएफएफ एडीए को वीडियो जैसे मल्टीमीडिया वर्कलोड के लिए एक अच्छा समाधान बनाती है।
| आरटीएक्स ए4000 एडीए | एनवीडिया आरटीएक्स ए4000 | एनवीडिया आरटीएक्स ए5000 | आरटीएक्स 3090 |
---|---|---|---|---|
वास्तुकला | एडा लवलेस | एम्पेयर | एम्पेयर | एम्पेयर |
तकनीकी प्रक्रिया | 5 एनएम | 8 एनएम | 8 एनएम | 8 एनएम |
जीपीयू | एडी104 | GA102 | GA104 | GA102 |
ट्रांजिस्टर की संख्या (लाखों) | 35,800 | 17,400 | 28,300 | 28,300 |
मेमोरी बैंडविड्थ (जीबी/एस) | 280.0 | 448 | 768 | 936.2 |
वीडियो मेमोरी क्षमता (बिट्स) | 160 | 256 | 384 | 384 |
जीपीयू मेमोरी (जीबी) | 20 | 16 | 24 | 24 |
मेमोरी प्रकार | जीडीडीआर6 | जीडीडीआर6 | जीडीडीआर6 | GDDR6X |
CUDA कोर | 6,144 | 6 144 | 8192 | 10496 |
टेंसर कोर | 192 | 192 | 256 | 328 |
आरटी कोर | 48 | 48 | 64 | 82 |
एसपी पर्फ (टेराफ्लॉप्स) | 19.2 | 19,2 | 27,8 | 35,6 |
आरटी कोर प्रदर्शन (टेराफ्लॉप्स) | 44.3 | 37,4 | 54,2 | 69,5 |
टेंसर प्रदर्शन (टेराफ्लॉप्स) | 306.8 | 153,4 | 222,2 | 285 |
अधिकतम शक्ति (वाट) | 70 | 140 | 230 | 350 |
इंटरफेस | पीसीआईई 4.0 x 16 | पीसीआई-ई 4.0 x16 | पीसीआई-ई 4.0 x16 | पीसीआईई 4.0 x16 |
कनेक्टर्स | 4x मिनी डिस्प्लेपोर्ट 1.4ए | डीपी 1.4 (4) | डीपी 1.4 (4) | डीपी 1.4 (4) |
बनाने का कारक | 2 स्लॉट | 1 स्लॉट | 2 स्लॉट | 2-3 स्लॉट |
वीजीपीयू सॉफ्टवेयर | नहीं | नहीं | हाँ, असीमित | हाँ। सीमाओं के साथ |
एनवीलिंक | नहीं | नहीं | 2x आरटीएक्स ए5000 | हाँ |
सीयूडीए समर्थन | 11.6 | 8.6 | 8.6 | 8.6 |
वल्कन समर्थन | 1.3 | हाँ | हाँ | हाँ, 1.2 |
मूल्य (USD) | 1,250 | 1000 | 2500 | 1400 |
| आरटीएक्स ए4000 एडीए | आरटीएक्स ए4000 |
---|---|---|
CPU | AMD Ryzen 9 5950X 3.4GHz (16 कोर) | ऑक्टाकोर इंटेल झियोन ई-2288जी, 3.5 गीगाहर्ट्ज़ |
टक्कर मारना | 4x 32 जीबी डीडीआर4 ईसीसी एसओ-डीआईएमएम | 2x 32 जीबी डीडीआर4-3200 ईसीसी डीडीआर4 एसडीआरएएम 1600 मेगाहर्ट्ज |
गाड़ी चलाना | 1टीबी एनवीएमई एसएसडी | सैमसंग एसएसडी 980 प्रो 1टीबी |
मदरबोर्ड | ASRock X570D4I-2T | आसुस P11C-I सीरीज |
ऑपरेटिंग सिस्टम | माइक्रोसॉफ्ट विंडोज 10 | माइक्रोसॉफ्ट विंडोज 10 |
वी-रे 5 बेंचमार्क
वी-रे जीपीयू सीयूडीए और आरटीएक्स परीक्षण सापेक्ष जीपीयू रेंडरिंग प्रदर्शन को मापते हैं। RTX A4000 GPU, RTX A4000 ADA (क्रमशः 4% और 11%) से थोड़ा पीछे है।
यंत्र अधिगम
"कुत्ते बनाम बिल्लियाँ"
तंत्रिका नेटवर्क के लिए जीपीयू के प्रदर्शन की तुलना करने के लिए, हमने "कुत्ते बनाम बिल्लियाँ" डेटासेट का उपयोग किया - परीक्षण एक तस्वीर की सामग्री का विश्लेषण करता है और यह पहचानता है कि तस्वीर में बिल्ली या कुत्ता दिखाई दे रहा है या नहीं। सभी आवश्यक कच्चा डेटा पाया जा सकता है
इस परीक्षण में, RTX A4000 ADA ने RTX A4000 से 9% बेहतर प्रदर्शन किया, लेकिन नए GPU के छोटे आकार और कम बिजली खपत को ध्यान में रखें।
एआई-बेंचमार्क आपको एआई मॉडल आउटपुट कार्य के दौरान डिवाइस के प्रदर्शन को मापने की अनुमति देता है। माप की इकाई परीक्षण के अनुसार भिन्न हो सकती है, लेकिन आमतौर पर यह प्रति सेकंड संचालन की संख्या (ओपीएस) या फ्रेम प्रति सेकंड (एफपीएस) की संख्या होती है।
| आरटीएक्स ए4000 | आरटीएक्स ए4000 एडीए |
---|---|---|
1/19. मोबाइलनेट-V2 | 1.1 - अनुमान | बैच=50, आकार=224x224: 38.5 ± 2.4 एमएस1.2 — प्रशिक्षण | बैच=50, आकार=224x224: 109 ± 4 एमएस | 1.1 - अनुमान | बैच=50, आकार=224x224: 53.5 ± 0.7 एमएस1.2 — प्रशिक्षण | बैच=50, आकार=224x224: 130.1 ± 0.6 एमएस |
2/19. आरंभ-V3 | 2.1 - अनुमान | बैच=20, आकार=346x346: 36.1 ± 1.8 एमएस2.2 — प्रशिक्षण | बैच=20, आकार=346x346: 137.4 ± 0.6 एमएस | 2.1 - अनुमान | बैच=20, आकार=346x346: 36.8 ± 1.1 एमएस2.2 — प्रशिक्षण | बैच=20, आकार=346x346: 147.5 ± 0.8 एमएस |
3/19. आरंभ-V4 | 3.1 - अनुमान | बैच=10, आकार=346x346: 34.0 ± 0.9 एमएस3.2 — प्रशिक्षण | बैच=10, आकार=346x346: 139.4 ± 1.0 एमएस | 3.1 - अनुमान | बैच=10, आकार=346x346: 33.0 ± 0.8 एमएस3.2 — प्रशिक्षण | बैच=10, आकार=346x346: 135.7 ± 0.9 एमएस |
4/19. इंसेप्शन-रेसनेट-V2 | 4.1 - अनुमान | बैच=10, आकार=346x346: 45.7 ± 0.6 एमएस4.2 — प्रशिक्षण | बैच=8, आकार=346x346: 153.4 ± 0.8 एमएस | 4.1 - अनुमान बैच = 10, आकार = 346x346: 33.6 ± 0.7 एमएस4.2 - प्रशिक्षण बैच = 8, आकार = 346x346: 132 ± 1 एमएस |
5/19. रेसनेट-V2-50 | 5.1 — अनुमान | बैच=10, आकार=346x346: 25.3 ± 0.5 एमएस5.2 — प्रशिक्षण | बैच=10, आकार=346x346: 91.1 ± 0.8 एमएस | 5.1 — अनुमान | बैच=10, आकार=346x346: 26.1 ± 0.5 एमएस5.2 — प्रशिक्षण | बैच=10, आकार=346x346: 92.3 ± 0.6 एमएस |
6/19. रेसनेट-V2-152 | 6.1 - अनुमान | बैच=10, आकार=256x256: 32.4 ± 0.5 एमएस6.2 — प्रशिक्षण | बैच=10, आकार=256x256: 131.4 ± 0.7 एमएस | 6.1 - अनुमान | बैच=10, आकार=256x256: 23.7 ± 0.6 एमएस6.2 — प्रशिक्षण | बैच=10, आकार=256x256: 107.1 ± 0.9 एमएस |
7/19. वीजीजी-16 | 7.1 — अनुमान | बैच=20, आकार=224x224: 54.9 ± 0.9 एमएस7.2 — प्रशिक्षण | बैच=2, आकार=224x224: 83.6 ± 0.7 एमएस | 7.1 — अनुमान | बैच=20, आकार=224x224: 66.3 ± 0.9 एमएस7.2 — प्रशिक्षण | बैच=2, आकार=224x224: 109.3 ± 0.8 एमएस |
8/19. एसआरसीएनएन 9-5-5 | 8.1 — अनुमान | बैच=10, आकार=512x512: 51.5 ± 0.9 एमएस8.2 — अनुमान | बैच=1, आकार=1536x1536: 45.7 ± 0.9 एमएस8.3 — प्रशिक्षण | बैच=10, आकार=512x512: 183 ± 1 एमएस | 8.1 — अनुमान | बैच=10, आकार=512x512: 59.9 ± 1.6 एमएस8.2 — अनुमान | बैच=1, आकार=1536x1536: 53.1 ± 0.7 एमएस8.3 — प्रशिक्षण | बैच=10, आकार=512x512: 176 ± 2 एमएस |
9/19. वीजीजी-19 सुपर-रेस | 9.1 - अनुमान | बैच=10, आकार=256x256: 99.5 ± 0.8 एमएस9.2 — अनुमान | बैच=1, आकार=1024x1024: 162 ± 1 एमएस9.3 — प्रशिक्षण | बैच=10, आकार=224x224: 204 ± 2 एमएस | |
10/19. रेसनेट-एसआरजीएएन | 10.1 — अनुमान | बैच=10, आकार=512x512: 85.8 ± 0.6 एमएस10.2 — अनुमान | बैच=1, आकार=1536x1536: 82.4 ± 1.9 एमएस10.3 — प्रशिक्षण | बैच=5, आकार=512x512: 133 ± 1 एमएस | 10.1 — अनुमान | बैच=10, आकार=512x512: 98.9 ± 0.8 एमएस10.2 — अनुमान | बैच=1, आकार=1536x1536: 86.1 ± 0.6 एमएस10.3 — प्रशिक्षण | बैच=5, आकार=512x512: 130.9 ± 0.6 एमएस |
11/19. रेसनेट-डीपीईडी | 11.1 — अनुमान | बैच=10, आकार=256x256: 114.9 ± 0.6 एमएस11.2 — अनुमान | बैच=1, आकार=1024x1024: 182 ± 2 एमएस11.3 — प्रशिक्षण | बैच=15, आकार=128x128: 178.1 ± 0.8 एमएस | 11.1 — अनुमान | बैच=10, आकार=256x256: 146.4 ± 0.5 एमएस11.2 — अनुमान | बैच=1, आकार=1024x1024: 234.3 ± 0.5 एमएस11.3 — प्रशिक्षण | बैच=15, आकार=128x128: 234.7 ± 0.6 एमएस |
12/19. यू-नेट | 12.1 — अनुमान | बैच=4, आकार=512x512: 180.8 ± 0.7 एमएस12.2 — अनुमान | बैच=1, आकार=1024x1024: 177.0 ± 0.4 एमएस12.3 — प्रशिक्षण | बैच=4, आकार=256x256: 198.6 ± 0.5 एमएस | 12.1 — अनुमान | बैच=4, आकार=512x512: 222.9 ± 0.5 एमएस12.2 — अनुमान | बैच=1, आकार=1024x1024: 220.4 ± 0.6 एमएस12.3 — प्रशिक्षण | बैच=4, आकार=256x256: 229.1 ± 0.7 एमएस |
13/19. एनवीडिया-स्पेड | 13.1 — अनुमान | बैच=5, आकार=128x128: 54.5 ± 0.5 एमएस13.2 — प्रशिक्षण | बैच=1, आकार=128x128: 103.6 ± 0.6 एमएस | 13.1 — अनुमान | बैच=5, आकार=128x128: 59.6 ± 0.6 एमएस13.2 — प्रशिक्षण | बैच=1, आकार=128x128: 94.6 ± 0.6 एमएस |
14/19. आईसीनेट | 14.1 — अनुमान | बैच=5, आकार=1024x1536: 126.3 ± 0.8 एमएस14.2 — प्रशिक्षण | बैच=10, आकार=1024x1536: 426 ± 9 एमएस | 14.1 — अनुमान | बैच=5, आकार=1024x1536: 144 ± 4 एमएस14.2 — प्रशिक्षण | बैच=10, आकार=1024x1536: 475 ± 17 एमएस |
15/19. पीएसपीनेट | 15.1 — अनुमान | बैच=5, आकार=720x720: 249 ± 12 एमएस15.2 — प्रशिक्षण | बैच=1, आकार=512x512: 104.6 ± 0.6 एमएस | 15.1 — अनुमान | बैच=5, आकार=720x720: 291.4 ± 0.5 एमएस15.2 — प्रशिक्षण | बैच=1, आकार=512x512: 99.8 ± 0.9 एमएस |
16/19. डीपलैब | 16.1 — अनुमान | बैच=2, आकार=512x512: 71.7 ± 0.6 एमएस16.2 — प्रशिक्षण | बैच=1, आकार=384x384: 84.9 ± 0.5 एमएस | 16.1 — अनुमान | बैच=2, आकार=512x512: 71.5 ± 0.7 एमएस16.2 — प्रशिक्षण | बैच=1, आकार=384x384: 69.4 ± 0.6 एमएस |
17/19. पिक्सेल-आरएनएन | 17.1 — अनुमान | बैच=50, आकार=64x64: 299 ± 14 एमएस17.2 — प्रशिक्षण | बैच=10, आकार=64x64: 1258 ± 64 एमएस | 17.1 — अनुमान | बैच=50, आकार=64x64: 321 ± 30 एमएस17.2 — प्रशिक्षण | बैच=10, आकार=64x64: 1278 ± 74 एमएस |
18/19. LSTM-भावना | 18.1 — अनुमान | बैच=100, आकार=1024x300: 395 ± 11 एमएस18.2 — प्रशिक्षण | बैच=10, आकार=1024x300: 676 ± 15 एमएस | 18.1 — अनुमान | बैच=100, आकार=1024x300: 345 ± 10 एमएस18.2 — प्रशिक्षण | बैच=10, आकार=1024x300: 774 ± 17 एमएस |
19/19. जीएनएमटी-अनुवाद | 19.1 — अनुमान | बैच=1, आकार=1x20: 119 ± 2 एमएस | 19.1 — अनुमान | बैच=1, आकार=1x20: 156 ± 1 एमएस |
इस परीक्षण के नतीजे बताते हैं कि आरटीएक्स ए4000 का प्रदर्शन आरटीएक्स ए4000 एडीए से 6% अधिक है, हालांकि, इस चेतावनी के साथ कि परीक्षण के परिणाम नियोजित विशिष्ट कार्य और परिचालन स्थितियों के आधार पर भिन्न हो सकते हैं।
आरटीएक्स ए 4000
बेंच मार्किंग | मॉडल औसत ट्रेन समय (एमएस) |
---|---|
प्रशिक्षण डबल परिशुद्धता प्रकार mnasnet0_5 | 62.995805740356445 |
प्रशिक्षण डबल परिशुद्धता प्रकार mnasnet0_75 | 98.39066505432129 |
प्रशिक्षण डबल परिशुद्धता प्रकार mnasnet1_0 | 126.60405158996582 |
प्रशिक्षण डबल परिशुद्धता प्रकार mnasnet1_3 | 186.89460277557373 |
प्रशिक्षण डबल परिशुद्धता प्रकार resnet18 | 428.08079719543457 |
प्रशिक्षण डबल परिशुद्धता प्रकार resnet34 | 883.5790348052979 |
प्रशिक्षण डबल परिशुद्धता प्रकार resnet50 | 1016.3950300216675 |
प्रशिक्षण डबल परिशुद्धता प्रकार resnet101 | 1927.2308254241943 |
प्रशिक्षण डबल परिशुद्धता प्रकार resnet152 | 2815.663013458252 |
प्रशिक्षण डबल परिशुद्धता प्रकार resnext50_32x4d | 1075.4373741149902 |
प्रशिक्षण डबल परिशुद्धता प्रकार resnext101_32x8d | 4050.0641918182373 |
प्रशिक्षण डबल प्रिसिजन टाइप वाइड_रेसनेट50_2 | 2615.9953451156616 |
प्रशिक्षण डबल प्रिसिजन टाइप वाइड_रेसनेट101_2 | 5218.524832725525 |
प्रशिक्षण डबल परिशुद्धता प्रकार Densnet121 | 751.9759511947632 |
प्रशिक्षण डबल प्रिसिजन टाइप डेंसनेट169 | 910.3225564956665 |
प्रशिक्षण डबल परिशुद्धता प्रकार Densnet201 | 1163.036551475525 |
प्रशिक्षण डबल प्रिसिजन टाइप डेंसनेट161 | 2141.505298614502 |
प्रशिक्षण डबल प्रिसिजन टाइप स्क्वीज़नेट1_0 | 203.14435005187988 |
प्रशिक्षण डबल प्रिसिजन टाइप स्क्वीज़नेट1_1 | 98.04857730865479 |
प्रशिक्षण डबल परिशुद्धता प्रकार vgg11 | 1697.710485458374 |
प्रशिक्षण डबल परिशुद्धता प्रकार vgg11_bn | 1729.2972660064697 |
प्रशिक्षण डबल परिशुद्धता प्रकार vgg13 | 2491.615080833435 |
प्रशिक्षण डबल परिशुद्धता प्रकार vgg13_bn | 2545.1631927490234 |
प्रशिक्षण डबल परिशुद्धता प्रकार vgg16 | 3371.1953449249268 |
प्रशिक्षण डबल परिशुद्धता प्रकार vgg16_bn | 3423.8639068603516 |
प्रशिक्षण डबल परिशुद्धता प्रकार vgg19_bn | 4314.5153522491455 |
प्रशिक्षण डबल परिशुद्धता प्रकार vgg19 | 4249.422650337219 |
प्रशिक्षण डबल परिशुद्धता प्रकार mobilenet_v3_large | 105.54619789123535 |
प्रशिक्षण डबल परिशुद्धता प्रकार mobilenet_v3_small | 37.6680850982666 |
प्रशिक्षण डबल परिशुद्धता प्रकार शफ़लनेट_v2_x0_5 | 26.51611328125 |
प्रशिक्षण डबल परिशुद्धता प्रकार शफ़लनेट_v2_x1_0 | 61.260504722595215 |
प्रशिक्षण डबल परिशुद्धता प्रकार शफ़लनेट_v2_x1_5 | 105.30067920684814 |
प्रशिक्षण डबल परिशुद्धता प्रकार शफ़लनेट_v2_x2_0 | 181.03694438934326 |
अनुमान डबल परिशुद्धता प्रकार mnasnet0_5 | 17.397074699401855 |
अनुमान डबल परिशुद्धता प्रकार mnasnet0_75 | 28.902697563171387 |
अनुमान डबल परिशुद्धता प्रकार mnasnet1_0 | 38.387718200683594 |
अनुमान डबल परिशुद्धता प्रकार mnasnet1_3 | 58.228821754455566 |
अनुमान डबल परिशुद्धता प्रकार resnet18 | 147.95727252960205 |
अनुमान डबल परिशुद्धता प्रकार resnet34 | 293.519492149353 |
अनुमान डबल परिशुद्धता प्रकार resnet50 | 336.44991874694824 |
अनुमान डबल परिशुद्धता प्रकार resnet101 | 637.9982376098633 |
अनुमान डबल परिशुद्धता प्रकार resnet152 | 948.9351654052734 |
अनुमान डबल परिशुद्धता प्रकार resnext50_32x4d | 372.80876636505127 |
अनुमान डबल परिशुद्धता प्रकार resnext101_32x8d | 1385.1624917984009 |
अनुमान डबल परिशुद्धता प्रकार width_resnet50_2 | 873.048791885376 |
अनुमान डबल परिशुद्धता प्रकार width_resnet101_2 | 1729.2765426635742 |
अनुमान डबल परिशुद्धता प्रकार Densnet121 | 270.13323307037354 |
अनुमान डबल परिशुद्धता प्रकार डेंसनेट169 | 327.1932888031006 |
अनुमान डबल परिशुद्धता प्रकार Densnet201 | 414.733362197876 |
अनुमान डबल परिशुद्धता प्रकार डेंसनेट161 | 766.3542318344116 |
अनुमान डबल परिशुद्धता प्रकार स्क्वीज़नेट1_0 | 74.86292839050293 |
अनुमान डबल प्रिसिजन प्रकार स्क्वीज़नेट1_1 | 34.04905319213867 |
अनुमान डबल परिशुद्धता प्रकार vgg11 | 576.3767147064209 |
अनुमान डबल परिशुद्धता प्रकार vgg11_bn | 580.5839586257935 |
अनुमान डबल परिशुद्धता प्रकार vgg13 | 853.4365510940552 |
अनुमान डबल परिशुद्धता प्रकार vgg13_bn | 860.3136301040649 |
अनुमान डबल परिशुद्धता प्रकार vgg16 | 1145.091052055359 |
अनुमान डबल परिशुद्धता प्रकार vgg16_bn | 1152.8028392791748 |
अनुमान डबल परिशुद्धता प्रकार vgg19_bn | 1444.9562692642212 |
अनुमान डबल परिशुद्धता प्रकार vgg19 | 1437.0987701416016 |
अनुमान डबल परिशुद्धता प्रकार mobilenet_v3_large | 30.876317024230957 |
अनुमान डबल परिशुद्धता प्रकार mobilenet_v3_small | 11.234536170959473 |
अनुमान डबल परिशुद्धता प्रकार shufflenet_v2_x0_5 | 7.425284385681152 |
अनुमान डबल परिशुद्धता प्रकार shufflenet_v2_x1_0 | 18.25782299041748 |
अनुमान डबल परिशुद्धता प्रकार shufflenet_v2_x1_5 | 33.34946632385254 |
अनुमान डबल परिशुद्धता प्रकार shufflenet_v2_x2_0 | 57.84676551818848 |
आरटीएक्स ए4000 एडीए
बेंच मार्किंग | मॉडल औसत ट्रेन समय |
---|---|
प्रशिक्षण आधा परिशुद्धता प्रकार mnasnet0_5 | 20.266618728637695 |
प्रशिक्षण आधा परिशुद्धता प्रकार mnasnet0_75 | 21.445374488830566 |
प्रशिक्षण आधा परिशुद्धता प्रकार mnasnet1_0 | 26.714019775390625 |
प्रशिक्षण आधा परिशुद्धता प्रकार mnasnet1_3 | 26.5126371383667 |
प्रशिक्षण आधा परिशुद्धता प्रकार resnet18 | 19.624991416931152 |
प्रशिक्षण आधा परिशुद्धता प्रकार resnet34 | 32.46446132659912 |
प्रशिक्षण आधा परिशुद्धता प्रकार resnet50 | 57.17473030090332 |
प्रशिक्षण आधा परिशुद्धता प्रकार resnet101 | 98.20127010345459 |
प्रशिक्षण आधा परिशुद्धता प्रकार resnet152 | 138.18389415740967 |
प्रशिक्षण आधा परिशुद्धता प्रकार resnext50_32x4d | 75.56005001068115 |
प्रशिक्षण आधा परिशुद्धता प्रकार resnext101_32x8d | 228.8706636428833 |
प्रशिक्षण अर्ध परिशुद्धता प्रकार वाइड_रेसनेट50_2 | 113.76442432403564 |
प्रशिक्षण अर्ध परिशुद्धता प्रकार वाइड_रेसनेट101_2 | 204.17311191558838 |
प्रशिक्षण आधा परिशुद्धता प्रकार Densnet121 | 68.97401332855225 |
प्रशिक्षण अर्ध परिशुद्धता प्रकार डेंसनेट169 | 85.16453742980957 |
प्रशिक्षण आधा परिशुद्धता प्रकार Densnet201 | 103.299241065979 |
प्रशिक्षण अर्ध परिशुद्धता प्रकार डेंसनेट161 | 137.54578113555908 |
प्रशिक्षण अर्ध परिशुद्धता प्रकार स्क्वीज़नेट1_0 | 16.71830177307129 |
प्रशिक्षण अर्ध परिशुद्धता प्रकार स्क्वीज़नेट1_1 | 12.906527519226074 |
प्रशिक्षण आधा परिशुद्धता प्रकार vgg11 | 51.7004919052124 |
प्रशिक्षण आधा परिशुद्धता प्रकार vgg11_bn | 57.63327598571777 |
प्रशिक्षण आधा परिशुद्धता प्रकार vgg13 | 86.10869407653809 |
प्रशिक्षण आधा परिशुद्धता प्रकार vgg13_bn | 95.86676120758057 |
प्रशिक्षण आधा परिशुद्धता प्रकार vgg16 | 102.91589260101318 |
प्रशिक्षण आधा परिशुद्धता प्रकार vgg16_bn | 113.74778270721436 |
प्रशिक्षण आधा परिशुद्धता प्रकार vgg19_bn | 131.56734943389893 |
प्रशिक्षण आधा परिशुद्धता प्रकार vgg19 | 119.70191955566406 |
प्रशिक्षण आधा परिशुद्धता प्रकार mobilenet_v3_large | 31.30636692047119 |
प्रशिक्षण आधा परिशुद्धता प्रकार mobilenet_v3_small | 19.44464683532715 |
प्रशिक्षण अर्ध परिशुद्धता प्रकार शफ़लनेट_v2_x0_5 | 13.710575103759766 |
प्रशिक्षण अर्ध परिशुद्धता प्रकार शफ़लनेट_v2_x1_0 | 23.608479499816895 |
प्रशिक्षण अर्ध परिशुद्धता प्रकार शफ़लनेट_v2_x1_5 | 26.793746948242188 |
प्रशिक्षण अर्ध परिशुद्धता प्रकार शफ़लनेट_v2_x2_0 | 24.550962448120117 |
अनुमान आधा परिशुद्धता प्रकार mnasnet0_5 | 4.418272972106934 |
अनुमान आधा परिशुद्धता प्रकार mnasnet0_75 | 4.021778106689453 |
अनुमान आधा परिशुद्धता प्रकार mnasnet1_0 | 4.42598819732666 |
अनुमान आधा परिशुद्धता प्रकार mnasnet1_3 | 4.618926048278809 |
अनुमान आधा परिशुद्धता प्रकार resnet18 | 5.803341865539551 |
अनुमान आधा परिशुद्धता प्रकार resnet34 | 9.756693840026855 |
अनुमान आधा परिशुद्धता प्रकार resnet50 | 15.873079299926758 |
अनुमान आधा परिशुद्धता प्रकार resnet101 | 28.268003463745117 |
अनुमान आधा परिशुद्धता प्रकार resnet152 | 40.04594326019287 |
अनुमान आधा परिशुद्धता प्रकार resnext50_32x4d | 19.53421115875244 |
अनुमान आधा परिशुद्धता प्रकार resnext101_32x8d | 62.44826316833496 |
अनुमान आधा परिशुद्धता प्रकार width_resnet50_2 | 33.533992767333984 |
अनुमान आधा परिशुद्धता प्रकार width_resnet101_2 | 59.60897445678711 |
अनुमान आधा परिशुद्धता प्रकार Densnet121 | 18.052735328674316 |
अनुमान आधा परिशुद्धता प्रकार Densnet169 | 21.956982612609863 |
अनुमान आधा परिशुद्धता प्रकार Densnet201 | 27.85182476043701 |
अनुमान आधा परिशुद्धता प्रकार डेंसनेट161 | 37.41891860961914 |
अनुमान आधा परिशुद्धता प्रकार स्क्वीज़नेट1_0 | 4.391803741455078 |
अनुमान आधा परिशुद्धता प्रकार स्क्वीज़नेट1_1 | 2.4281740188598633 |
अनुमान आधा परिशुद्धता प्रकार vgg11 | 17.11493968963623 |
अनुमान आधा परिशुद्धता प्रकार vgg11_bn | 18.40585231781006 |
अनुमान आधा परिशुद्धता प्रकार vgg13 | 28.438148498535156 |
अनुमान आधा परिशुद्धता प्रकार vgg13_bn | 30.672597885131836 |
अनुमान आधा परिशुद्धता प्रकार vgg16 | 34.43562984466553 |
अनुमान आधा परिशुद्धता प्रकार vgg16_bn | 36.92122936248779 |
अनुमान आधा परिशुद्धता प्रकार vgg19_bn | 43.144264221191406 |
अनुमान आधा परिशुद्धता प्रकार vgg19 | 40.5385684967041 |
अनुमान आधा परिशुद्धता प्रकार mobilenet_v3_large | 5.350713729858398 |
अनुमान आधा परिशुद्धता प्रकार mobilenet_v3_small | 4.016985893249512 |
अनुमान आधा परिशुद्धता प्रकार shufflenet_v2_x0_5 | 5.079126358032227 |
अनुमान आधा परिशुद्धता प्रकार shufflenet_v2_x1_0 | 5.593156814575195 |
अनुमान आधा परिशुद्धता प्रकार shufflenet_v2_x1_5 | 5.649552345275879 |
अनुमान आधा परिशुद्धता प्रकार shufflenet_v2_x2_0 | 5.355663299560547 |
प्रशिक्षण डबल परिशुद्धता प्रकार mnasnet0_5 | 50.2386999130249 |
प्रशिक्षण डबल परिशुद्धता प्रकार mnasnet0_75 | 80.66896915435791 |
प्रशिक्षण डबल परिशुद्धता प्रकार mnasnet1_0 | 103.32422733306885 |
प्रशिक्षण डबल परिशुद्धता प्रकार mnasnet1_3 | 154.6230697631836 |
प्रशिक्षण डबल परिशुद्धता प्रकार resnet18 | 337.94031620025635 |
प्रशिक्षण डबल परिशुद्धता प्रकार resnet34 | 677.7706575393677 |
प्रशिक्षण डबल परिशुद्धता प्रकार resnet50 | 789.9243211746216 |
प्रशिक्षण डबल परिशुद्धता प्रकार resnet101 | 1484.3351316452026 |
प्रशिक्षण डबल परिशुद्धता प्रकार resnet152 | 2170.570478439331 |
प्रशिक्षण डबल परिशुद्धता प्रकार resnext50_32x4d | 877.3719882965088 |
प्रशिक्षण डबल परिशुद्धता प्रकार resnext101_32x8d | 3652.4944639205933 |
प्रशिक्षण डबल प्रिसिजन टाइप वाइड_रेसनेट50_2 | 2154.612874984741 |
प्रशिक्षण डबल प्रिसिजन टाइप वाइड_रेसनेट101_2 | 4176.522083282471 |
प्रशिक्षण डबल परिशुद्धता प्रकार Densnet121 | 607.8699731826782 |
प्रशिक्षण डबल प्रिसिजन टाइप डेंसनेट169 | 744.6409797668457 |
प्रशिक्षण डबल परिशुद्धता प्रकार Densnet201 | 962.677731513977 |
प्रशिक्षण डबल प्रिसिजन टाइप डेंसनेट161 | 1759.772515296936 |
प्रशिक्षण डबल प्रिसिजन टाइप स्क्वीज़नेट1_0 | 164.3690824508667 |
प्रशिक्षण डबल प्रिसिजन टाइप स्क्वीज़नेट1_1 | 78.70647430419922 |
प्रशिक्षण डबल परिशुद्धता प्रकार vgg11 | 1362.6095294952393 |
प्रशिक्षण डबल परिशुद्धता प्रकार vgg11_bn | 1387.2539138793945 |
प्रशिक्षण डबल परिशुद्धता प्रकार vgg13 | 2006.0230445861816 |
प्रशिक्षण डबल परिशुद्धता प्रकार vgg13_bn | 2047.526364326477 |
प्रशिक्षण डबल परिशुद्धता प्रकार vgg16 | 2702.2086429595947 |
प्रशिक्षण डबल परिशुद्धता प्रकार vgg16_bn | 2747.241234779358 |
प्रशिक्षण डबल परिशुद्धता प्रकार vgg19_bn | 3447.1724700927734 |
प्रशिक्षण डबल परिशुद्धता प्रकार vgg19 | 3397.990345954895 |
प्रशिक्षण डबल परिशुद्धता प्रकार mobilenet_v3_large | 84.65698719024658 |
प्रशिक्षण डबल परिशुद्धता प्रकार mobilenet_v3_small | 29.816465377807617 |
प्रशिक्षण डबल परिशुद्धता प्रकार शफ़लनेट_v2_x0_5 | 27.401342391967773 |
प्रशिक्षण डबल परिशुद्धता प्रकार शफ़लनेट_v2_x1_0 | 48.322744369506836 |
प्रशिक्षण डबल परिशुद्धता प्रकार शफ़लनेट_v2_x1_5 | 82.22103118896484 |
प्रशिक्षण डबल परिशुद्धता प्रकार शफ़लनेट_v2_x2_0 | 141.7021369934082 |
अनुमान डबल परिशुद्धता प्रकार mnasnet0_5 | 12.988653182983398 |
अनुमान डबल परिशुद्धता प्रकार mnasnet0_75 | 22.422199249267578 |
अनुमान डबल परिशुद्धता प्रकार mnasnet1_0 | 30.056486129760742 |
अनुमान डबल परिशुद्धता प्रकार mnasnet1_3 | 46.953935623168945 |
अनुमान डबल परिशुद्धता प्रकार resnet18 | 118.04479122161865 |
अनुमान डबल परिशुद्धता प्रकार resnet34 | 231.52336597442627 |
अनुमान डबल परिशुद्धता प्रकार resnet50 | 268.63497734069824 |
अनुमान डबल परिशुद्धता प्रकार resnet101 | 495.2010440826416 |
अनुमान डबल परिशुद्धता प्रकार resnet152 | 726.4922094345093 |
अनुमान डबल परिशुद्धता प्रकार resnext50_32x4d | 291.47679328918457 |
अनुमान डबल परिशुद्धता प्रकार resnext101_32x8d | 1055.10901927948 |
अनुमान डबल परिशुद्धता प्रकार width_resnet50_2 | 690.6917667388916 |
अनुमान डबल परिशुद्धता प्रकार width_resnet101_2 | 1347.5529861450195 |
अनुमान डबल परिशुद्धता प्रकार Densnet121 | 224.35829639434814 |
अनुमान डबल परिशुद्धता प्रकार डेंसनेट169 | 268.9145278930664 |
अनुमान डबल परिशुद्धता प्रकार Densnet201 | 343.1972026824951 |
अनुमान डबल परिशुद्धता प्रकार डेंसनेट161 | 635.866231918335 |
अनुमान डबल परिशुद्धता प्रकार स्क्वीज़नेट1_0 | 61.92759037017822 |
अनुमान डबल प्रिसिजन प्रकार स्क्वीज़नेट1_1 | 27.009410858154297 |
अनुमान डबल परिशुद्धता प्रकार vgg11 | 462.3375129699707 |
अनुमान डबल परिशुद्धता प्रकार vgg11_bn | 468.4495782852173 |
अनुमान डबल परिशुद्धता प्रकार vgg13 | 692.8219032287598 |
अनुमान डबल परिशुद्धता प्रकार vgg13_bn | 703.3538103103638 |
अनुमान डबल परिशुद्धता प्रकार vgg16 | 924.4353818893433 |
अनुमान डबल परिशुद्धता प्रकार vgg16_bn | 936.5075063705444 |
अनुमान डबल परिशुद्धता प्रकार vgg19_bn | 1169.098300933838 |
अनुमान डबल परिशुद्धता प्रकार vgg19 | 1156.3771772384644 |
अनुमान डबल परिशुद्धता प्रकार mobilenet_v3_large | 24.2356014251709 |
अनुमान डबल परिशुद्धता प्रकार mobilenet_v3_small | 8.85490894317627 |
अनुमान डबल परिशुद्धता प्रकार shufflenet_v2_x0_5 | 6.360034942626953 |
अनुमान डबल परिशुद्धता प्रकार shufflenet_v2_x1_0 | 14.301743507385254 |
अनुमान डबल परिशुद्धता प्रकार shufflenet_v2_x1_5 | 24.863481521606445 |
अनुमान डबल परिशुद्धता प्रकार shufflenet_v2_x2_0 | 43.8505744934082 |
नया ग्राफ़िक्स कार्ड कई कार्य कार्यों के लिए एक प्रभावी समाधान साबित हुआ है। अपने कॉम्पैक्ट आकार के कारण, यह शक्तिशाली SFF (स्मॉल फॉर्म फैक्टर) कंप्यूटर के लिए आदर्श है। साथ ही, यह उल्लेखनीय है कि 160-बिट बस के साथ 6,144 CUDA कोर और 20GB मेमोरी इस कार्ड को बाज़ार में सबसे अधिक उत्पादक में से एक बनाती है। इसके अलावा, 70W का कम टीडीपी बिजली की खपत लागत को कम करने में मदद करता है। चार मिनी-डिस्प्लेपोर्ट पोर्ट कार्ड को कई मॉनिटरों के साथ या मल्टी-चैनल ग्राफिक्स समाधान के रूप में उपयोग करने की अनुमति देते हैं।
आरटीएक्स 4000 एसएफएफ एडीए पिछली पीढ़ियों की तुलना में एक महत्वपूर्ण प्रगति का प्रतिनिधित्व करता है, जो दोगुनी बिजली खपत वाले कार्ड के बराबर प्रदर्शन प्रदान करता है। बिना PCIe पावर कनेक्टर के, RTX 4000 SFF ADA को उच्च प्रदर्शन से समझौता किए बिना कम-पावर वर्कस्टेशन में एकीकृत करना आसान है।