আধুনিক এন্টারপ্রাইজ তার ডেটা দ্বারা নিজেকে সংজ্ঞায়িত করে। এটির জন্য AI/ML-এর জন্য একটি ডেটা পরিকাঠামোর পাশাপাশি একটি ডেটা পরিকাঠামো প্রয়োজন যা ব্যবসায়িক বুদ্ধিমত্তা, ডেটা বিশ্লেষণ এবং ডেটা বিজ্ঞানকে সমর্থন করতে সক্ষম একটি আধুনিক ডেটালেকের ভিত্তি। এটি সত্য যদি তারা পিছনে থাকে, শুরু করে বা উন্নত অন্তর্দৃষ্টির জন্য AI ব্যবহার করে। অদূর ভবিষ্যতের জন্য, এটি এমনভাবে হবে যে উদ্যোগগুলি অনুভূত হয়। এন্টারপ্রাইজে এআই কীভাবে বাজারে যায় তার বৃহত্তর সমস্যার একাধিক মাত্রা বা ধাপ রয়েছে। এর মধ্যে রয়েছে ডেটা ইনজেশন, ট্রান্সফর্মেশন, ট্রেনিং, ইনফারেন্সিং, প্রোডাকশন এবং আর্কাইভিং, প্রতিটি স্টেজে ডেটা শেয়ার করা। এই কাজের চাপগুলি অন্তর্নিহিত AI ডেটা পরিকাঠামোর জটিলতা বাড়ায়। এটি মালিকানার মোট খরচ (TCO) হ্রাস করার সময় উচ্চ কার্যকারিতা পরিকাঠামোর প্রয়োজন তৈরি করে।
MinIO exascale AI এবং অন্যান্য বৃহৎ স্কেল ডেটা লেক ওয়ার্কলোড সমর্থন করার জন্য ডেটা পরিকাঠামোর জন্য একটি ব্যাপক ব্লুপ্রিন্ট তৈরি করেছে। এটিকে MinIO ডেটাপড বলা হয়। এটি ব্যবহার করে পরিমাপের একক হল 100 PiB। কেন? কারণ বাস্তবতা হল যে এটি আজ এন্টারপ্রাইজে সাধারণ। এখানে কিছু দ্রুত উদাহরণ আছে:
প্রায় এক এক্সাবাইট গাড়ির ভিডিও সহ উত্তর আমেরিকার একটি অটোমোবাইল প্রস্তুতকারক৷
একটি জার্মান অটোমোবাইল প্রস্তুতকারক যেখানে 50 পিবি-র বেশি গাড়ি টেলিমেট্রি রয়েছে৷
জৈবিক, রাসায়নিক, এবং রোগী-কেন্দ্রিক ডেটা 50 PB-এর বেশি সহ একটি বায়োটেক ফার্ম
500 PB-এর বেশি লগ ফাইল সহ একটি সাইবার নিরাপত্তা সংস্থা৷
200 PB-এর বেশি ভিডিও সহ একটি মিডিয়া স্ট্রিমিং কোম্পানি৷
বিমান থেকে 80 পিবি-র বেশি ভূ-স্থানিক, লগ এবং টেলিমেট্রি ডেটা সহ একটি প্রতিরক্ষা ঠিকাদার
তারা আজ 100 পিবিতে না থাকলেও, তারা কয়েক চতুর্থাংশের মধ্যে থাকবে। গড় ফার্ম বছরে 42% হারে বৃদ্ধি পাচ্ছে, ডেটা-কেন্দ্রিক সংস্থাগুলি তার চেয়ে দ্বিগুণ হারে বৃদ্ধি পাচ্ছে, যদি বেশি না হয়।
MinIO ডেটাপড রেফারেন্স আর্কিটেকচারটি প্রায় যেকোনো স্কেল অর্জনের জন্য বিভিন্ন উপায়ে স্ট্যাক করা যেতে পারে - প্রকৃতপক্ষে আমাদের কাছে এমন গ্রাহক রয়েছে যারা এই ব্লুপ্রিন্টটি তৈরি করেছেন - সমস্ত পথ একটি এক্সাবাইটের অতীত এবং একাধিক হার্ডওয়্যার বিক্রেতাদের সাথে। MinIO DataPod একটি এন্ড-টু-এন্ড আর্কিটেকচার অফার করে যা অবকাঠামো প্রশাসকদের বিভিন্ন ধরনের AI এবং ML কাজের চাপের জন্য সাশ্রয়ী সমাধান স্থাপন করতে সক্ষম করে। এখানে আমাদের স্থাপত্যের যুক্তি রয়েছে।
এআই ওয়ার্কলোড, বিশেষ করে জেনারেটিভ এআই, সহজাতভাবে গণনার জন্য জিপিইউ প্রয়োজন। তারা অবিশ্বাস্য থ্রুপুট, মেমরি ব্যান্ডউইথ এবং সমান্তরাল প্রক্রিয়াকরণ ক্ষমতা সহ দর্শনীয় ডিভাইস। দ্রুত এবং দ্রুততর হয়ে উঠছে এমন GPUগুলির সাথে তাল মিলিয়ে চলার জন্য উচ্চ-গতির স্টোরেজ প্রয়োজন৷ এটি বিশেষভাবে সত্য যখন প্রশিক্ষণের ডেটা মেমরিতে ফিট করতে পারে না এবং প্রশিক্ষণ লুপগুলিকে স্টোরেজের জন্য আরও কল করতে হয়। তদুপরি, উদ্যোগগুলির কর্মক্ষমতার চেয়ে বেশি প্রয়োজন, তাদের সুরক্ষা, প্রতিলিপি এবং স্থিতিস্থাপকতাও প্রয়োজন।
এন্টারপ্রাইজ স্টোরেজ প্রয়োজনীয়তা দাবি করে যে আর্কিটেকচারটি কম্পিউট থেকে স্টোরেজ সম্পূর্ণভাবে আলাদা করে। এটি কম্পিউটের থেকে স্বতন্ত্রভাবে স্টোরেজ স্কেল করার অনুমতি দেয় এবং প্রদত্ত যে স্টোরেজ বৃদ্ধি সাধারণত কম্পিউট বৃদ্ধির চেয়ে এক বা একাধিক মাত্রার বেশি, এই পদ্ধতিটি উচ্চতর ক্ষমতা ব্যবহারের মাধ্যমে সর্বোত্তম অর্থনীতি নিশ্চিত করে।
নেটওয়ার্কিং অবকাঠামো 100 গিগাবিট প্রতি সেকেন্ডে (Gbps) ব্যান্ডউইথ লিঙ্কে AI ওয়ার্কলোড স্থাপনার জন্য প্রমিত হয়েছে। আধুনিক দিনের NVMe ড্রাইভগুলি গড়ে 7GBps থ্রুপুট প্রদান করে যা স্টোরেজ সার্ভার এবং GPU কম্পিউট সার্ভারের মধ্যে নেটওয়ার্ক ব্যান্ডউইথকে AI পাইপলাইন এক্সিকিউশন পারফরম্যান্সের জন্য বাধা হয়ে দাঁড়ায়।
Infiniband (IB) এর মতো জটিল নেটওয়ার্কিং সমাধানগুলির সাথে এই সমস্যার সমাধান করার বাস্তব সীমাবদ্ধতা রয়েছে। আমরা সুপারিশ করি যে এন্টারপ্রাইজগুলি বিদ্যমান, ইন্ডাস্ট্রি-স্ট্যান্ডার্ড ইথারনেট-ভিত্তিক সমাধানগুলি (যেমন, টিসিপির উপর HTTP) যেগুলি নিম্নলিখিত কারণে GPU-গুলির জন্য উচ্চ থ্রুপুটে ডেটা সরবরাহ করার জন্য বাক্সের বাইরে কাজ করে:
এটা কোন কাকতালীয় ঘটনা নয় যে পাবলিক ক্লাউডে AI ডেটা অবকাঠামো সবই অবজেক্ট স্টোরের উপরে তৈরি করা হয়। বা এটি একটি কাকতালীয় নয় যে প্রতিটি প্রধান ভিত্তি মডেল একটি বস্তুর দোকানে প্রশিক্ষিত হয়েছিল। এটি একটি ফাংশন যে POSIX AI দ্বারা প্রয়োজনীয় ডেটা স্কেলে কাজ করার জন্য খুব চ্যাট - লিগ্যাসি ফাইলারদের কোরাস যা দাবি করবে তা সত্ত্বেও।
একই আর্কিটেকচার যা পাবলিক ক্লাউডে AI সরবরাহ করে তা প্রাইভেট ক্লাউডে এবং স্পষ্টতই হাইব্রিড ক্লাউডে প্রয়োগ করা উচিত। অবজেক্ট স্টোরগুলি বিভিন্ন ডেটা ফরম্যাট এবং বিশাল পরিমাণে অসংগঠিত ডেটা পরিচালনা করতে পারদর্শী এবং কর্মক্ষমতার সাথে আপোস না করে ক্রমবর্ধমান ডেটা মিটমাট করার জন্য অনায়াসে স্কেল করতে পারে। তাদের ফ্ল্যাট নেমস্পেস এবং মেটাডেটা ক্ষমতা দক্ষ ডেটা ম্যানেজমেন্ট এবং প্রসেসিং সক্ষম করে যা বড় ডেটাসেটে দ্রুত অ্যাক্সেসের প্রয়োজন AI টাস্কগুলির জন্য অত্যন্ত গুরুত্বপূর্ণ।
যেহেতু উচ্চ-গতির GPU গুলি বিকশিত হয় এবং নেটওয়ার্ক ব্যান্ডউইথ 200/400/800 Gbps এবং তার পরেও মানসম্মত হয়, আধুনিক অবজেক্ট স্টোরগুলিই একমাত্র সমাধান যা পারফরম্যান্স SLA এবং AI ওয়ার্কলোডের স্কেল পূরণ করে৷
আমরা জানি যে জিপিইউগুলি শোয়ের তারকা এবং তারা হার্ডওয়্যার। কিন্তু এমনকি এনভিডিয়া আপনাকে বলবে গোপন সস হল CUDA। তবে চিপের বাইরে যান এবং অবকাঠামো বিশ্ব ক্রমবর্ধমান সফ্টওয়্যার-সংজ্ঞায়িত হচ্ছে। স্টোরেজের চেয়ে এটি কোথাও সত্য নয়৷ নিম্নলিখিত কারণে সফ্টওয়্যার-সংজ্ঞায়িত স্টোরেজ সমাধানগুলি স্কেলেবিলিটি, নমনীয়তা এবং ক্লাউড ইন্টিগ্রেশনের জন্য অপরিহার্য, নিম্নলিখিত কারণে প্রথাগত অ্যাপ্লায়েন্স-ভিত্তিক মডেলগুলিকে ছাড়িয়ে যায়:
ক্লাউড সামঞ্জস্যতা : সফ্টওয়্যার-সংজ্ঞায়িত স্টোরেজ ক্লাউড অপারেশনগুলির সাথে সারিবদ্ধ করে, একাধিক ক্লাউড জুড়ে চলতে পারে না এমন যন্ত্রপাতিগুলির বিপরীতে।
কন্টেইনারাইজেশন : ক্লাউড-নেটিভ সুবিধা হারানো এবং কুবারনেটস অর্কেস্ট্রেশন প্রতিরোধ করে অ্যাপ্লায়েন্সগুলি কন্টেইনারাইজ করা যাবে না।
হার্ডওয়্যার নমনীয়তা : সফ্টওয়্যার-সংজ্ঞায়িত স্টোরেজ বিস্তৃত হার্ডওয়্যারকে সমর্থন করে, প্রান্ত থেকে কোর পর্যন্ত, বিভিন্ন আইটি পরিবেশকে মিটমাট করে।
অভিযোজিত পারফরম্যান্স : সফ্টওয়্যার-সংজ্ঞায়িত স্টোরেজ অতুলনীয় নমনীয়তা প্রদান করে, বিভিন্ন চিপসেট জুড়ে দক্ষতার সাথে বিভিন্ন ক্ষমতা এবং কর্মক্ষমতা প্রয়োজনীয়তা পরিচালনা করে।
এক্সাবাইট স্কেলে, সরলতা এবং একটি ক্লাউড-ভিত্তিক অপারেটিং মডেল অত্যন্ত গুরুত্বপূর্ণ। অবজেক্ট স্টোরেজ, একটি সফ্টওয়্যার-সংজ্ঞায়িত সমাধান হিসাবে, কমোডিটি অফ-দ্য-শেল্ফ (COTS) হার্ডওয়্যার এবং যে কোনও গণনা প্ল্যাটফর্মে নির্বিঘ্নে কাজ করা উচিত, তা বেয়ার মেটাল, ভার্চুয়াল মেশিন বা পাত্রে হোক না কেন।
অবজেক্ট স্টোরেজের জন্য কাস্টম-বিল্ট হার্ডওয়্যার অ্যাপ্লায়েন্সগুলি প্রায়শই ব্যয়বহুল হার্ডওয়্যার এবং জটিল সমাধান সহ খারাপভাবে ডিজাইন করা সফ্টওয়্যারগুলির জন্য ক্ষতিপূরণ দেয়, যার ফলে মালিকানার উচ্চ মোট খরচ হয় (TCO)।
এআই উদ্যোগের জন্য MinIO ব্যবহারকারী এন্টারপ্রাইজ গ্রাহকরা এক্সাবাইট স্কেল ডেটা পরিকাঠামো 100PiB-এর পুনরাবৃত্তিযোগ্য ইউনিট হিসেবে তৈরি করে। এটি অবকাঠামো প্রশাসকদের স্থাপনা, রক্ষণাবেক্ষণ এবং স্কেলিং প্রক্রিয়া সহজ করতে সাহায্য করে কারণ এআই ডেটা সময়ের সাথে সাথে দ্রুতগতিতে বৃদ্ধি পায়। নীচে একটি 100PiB স্কেলের ডেটা অবকাঠামো তৈরির জন্য উপকরণের বিল (BOM) দেওয়া হল।
কম্পোনেন্ট | পরিমাণ |
---|---|
র্যাকের মোট সংখ্যা | 30 |
স্টোরেজ সার্ভারের মোট সংখ্যা | 330 |
র্যাক প্রতি স্টোরেজ সার্ভারের মোট সংখ্যা | 11 |
TOR সুইচের মোট সংখ্যা | 60 |
মেরুদণ্ডের সুইচের মোট সংখ্যা | 10 |
ইরেজার কোড স্ট্রাইপ সাইজ | 10 |
ইরেজার কোড সমতা | 4 |
কম্পোনেন্ট | বর্ণনা | পরিমাণ |
---|---|---|
তাক ঘের | 42U/45U স্লট রাক | 1 |
স্টোরেজ সার্ভার | 2U ফর্ম ফ্যাক্টর | 11 |
র্যাক সুইচ শীর্ষ | লেয়ার 2 সুইচ | 2 |
ব্যবস্থাপনা সুইচ | সম্মিলিত স্তর 2 এবং স্তর 3 | 1 |
নেটওয়ার্ক কেবল | AOC তারের | 30-40 |
শক্তি | RPDU এর সাথে ডুয়াল পাওয়ার সাপ্লাই | 17kW - 20kW |
কম্পোনেন্ট | স্পেসিফিকেশন |
---|---|
সার্ভার | 2U, একক সকেট |
সিপিইউ | 64 কোর, 128 * PCIe 4.0 লেন |
স্মৃতি | 256 জিবি |
নেটওয়ার্ক | ডুয়াল পোর্ট, 200gbe NIC |
ড্রাইভ বেস | 24 হট-সোয়াপ 2.5" U.2 NVMe |
ড্রাইভ করে | 30TB * 24 NVMe |
শক্তি | 1600W অপ্রয়োজনীয় পাওয়ার সাপ্লাই |
মোট কাঁচা ক্ষমতা | 720 টিবি |
ডেল : পাওয়ারএজ R7615 র্যাক সার্ভার
HPE : HPE ProLiant DL345 Gen11
সুপারমাইক্রো : A+ সার্ভার 2114S-WN24RT
কম্পোনেন্ট | স্পেসিফিকেশন | |
---|---|---|
র্যাক (TOR) স্যুইচের শীর্ষ | 32 * 100GbE QSFP 28 পোর্ট | |
মেরুদণ্ড সুইচ | 64 * 100GbE QSFP 28 পোর্ট | |
তারের | 100G QSFP 28 AOC | |
শক্তি | প্রতি সুইচ 500 ওয়াট | |
MinIO একাধিক গ্রাহকের সাথে এই আর্কিটেকচারটি যাচাই করেছে এবং অন্যরা প্রতি মাসে প্রতি টেরাবাইট প্রতি নিম্নোক্ত গড় মূল্য দেখতে আশা করবে। এটি একটি গড় রাস্তার মূল্য এবং প্রকৃত মূল্য কনফিগারেশন এবং হার্ডওয়্যার বিক্রেতার সম্পর্কের উপর নির্ভর করে পরিবর্তিত হতে পারে।
স্কেল | স্টোরেজ হার্ডওয়্যারের মূল্য **(প্রতি টিবি/মাস)** | MinIO সফ্টওয়্যার মূল্য **(প্রতি টিবি/মাস)** |
---|---|---|
100PiB | $1.50 | $3.54 |
AI-এর জন্য বিক্রেতা নির্দিষ্ট টার্নকি হার্ডওয়্যার অ্যাপ্লায়েন্সের ফলে উচ্চ TCO হবে এবং এক্সাবাইট স্কেলে বড় ডেটা AI উদ্যোগের জন্য ইউনিট অর্থনীতির দৃষ্টিকোণ থেকে মাপযোগ্য নয়।
সমস্ত AI/ML কাজের চাপের জন্য TCO উদ্দেশ্য পূরণ করার সময় এক্সাবাইট স্কেলে ডেটা ইনফ্রাস্ট্রাকচার সেটআপ জটিল এবং সঠিক হওয়া কঠিন হতে পারে। MinIO-এর DataPOD অবকাঠামোর ব্লুপ্রিন্ট অবকাঠামো প্রশাসকদের জন্য অত্যন্ত স্কেলযোগ্য, কার্যকরী সাশ্রয়ী S3 সামঞ্জস্যপূর্ণ MinIO এন্টারপ্রাইজ অবজেক্ট স্টোর সহ শেলফ হার্ডওয়্যারের বাইরে প্রয়োজনীয় পণ্য সেট আপ করা সহজ এবং সরল করে তোলে যার ফলে সামগ্রিকভাবে বাজারের সময় এবং দ্রুত সময়ের মূল্যের উন্নতি হয়। এন্টারপ্রাইজ ল্যান্ডস্কেপের মধ্যে প্রতিষ্ঠান জুড়ে এআই উদ্যোগ।