paint-brush
MinIO DataPod: Exascale Computing এর জন্য একটি রেফারেন্স আর্কিটেকচারদ্বারা@minio
7,519 পড়া
7,519 পড়া

MinIO DataPod: Exascale Computing এর জন্য একটি রেফারেন্স আর্কিটেকচার

দ্বারা MinIO7m2024/08/20
Read on Terminal Reader

অতিদীর্ঘ; পড়তে

MinIO exascale AI এবং অন্যান্য বৃহৎ স্কেল ডেটা লেক ওয়ার্কলোড সমর্থন করার জন্য ডেটা পরিকাঠামোর জন্য একটি ব্যাপক ব্লুপ্রিন্ট তৈরি করেছে। MinIO DataPod একটি এন্ড-টু-এন্ড আর্কিটেকচার অফার করে যা পরিকাঠামো প্রশাসকদের বিভিন্ন ধরনের AI এবং ML কাজের চাপের জন্য সাশ্রয়ী সমাধান স্থাপন করতে সক্ষম করে।
featured image - MinIO DataPod: Exascale Computing এর জন্য একটি রেফারেন্স আর্কিটেকচার
MinIO HackerNoon profile picture


আধুনিক এন্টারপ্রাইজ তার ডেটা দ্বারা নিজেকে সংজ্ঞায়িত করে। এটির জন্য AI/ML-এর জন্য একটি ডেটা পরিকাঠামোর পাশাপাশি একটি ডেটা পরিকাঠামো প্রয়োজন যা ব্যবসায়িক বুদ্ধিমত্তা, ডেটা বিশ্লেষণ এবং ডেটা বিজ্ঞানকে সমর্থন করতে সক্ষম একটি আধুনিক ডেটালেকের ভিত্তি। এটি সত্য যদি তারা পিছনে থাকে, শুরু করে বা উন্নত অন্তর্দৃষ্টির জন্য AI ব্যবহার করে। অদূর ভবিষ্যতের জন্য, এটি এমনভাবে হবে যে উদ্যোগগুলি অনুভূত হয়। এন্টারপ্রাইজে এআই কীভাবে বাজারে যায় তার বৃহত্তর সমস্যার একাধিক মাত্রা বা ধাপ রয়েছে। এর মধ্যে রয়েছে ডেটা ইনজেশন, ট্রান্সফর্মেশন, ট্রেনিং, ইনফারেন্সিং, প্রোডাকশন এবং আর্কাইভিং, প্রতিটি স্টেজে ডেটা শেয়ার করা। এই কাজের চাপগুলি অন্তর্নিহিত AI ডেটা পরিকাঠামোর জটিলতা বাড়ায়। এটি মালিকানার মোট খরচ (TCO) হ্রাস করার সময় উচ্চ কার্যকারিতা পরিকাঠামোর প্রয়োজন তৈরি করে।


MinIO exascale AI এবং অন্যান্য বৃহৎ স্কেল ডেটা লেক ওয়ার্কলোড সমর্থন করার জন্য ডেটা পরিকাঠামোর জন্য একটি ব্যাপক ব্লুপ্রিন্ট তৈরি করেছে। এটিকে MinIO ডেটাপড বলা হয়। এটি ব্যবহার করে পরিমাপের একক হল 100 PiB। কেন? কারণ বাস্তবতা হল যে এটি আজ এন্টারপ্রাইজে সাধারণ। এখানে কিছু দ্রুত উদাহরণ আছে:


  • প্রায় এক এক্সাবাইট গাড়ির ভিডিও সহ উত্তর আমেরিকার একটি অটোমোবাইল প্রস্তুতকারক৷

  • একটি জার্মান অটোমোবাইল প্রস্তুতকারক যেখানে 50 পিবি-র বেশি গাড়ি টেলিমেট্রি রয়েছে৷

  • জৈবিক, রাসায়নিক, এবং রোগী-কেন্দ্রিক ডেটা 50 PB-এর বেশি সহ একটি বায়োটেক ফার্ম

  • 500 PB-এর বেশি লগ ফাইল সহ একটি সাইবার নিরাপত্তা সংস্থা৷

  • 200 PB-এর বেশি ভিডিও সহ একটি মিডিয়া স্ট্রিমিং কোম্পানি৷

  • বিমান থেকে 80 পিবি-র বেশি ভূ-স্থানিক, লগ এবং টেলিমেট্রি ডেটা সহ একটি প্রতিরক্ষা ঠিকাদার


তারা আজ 100 পিবিতে না থাকলেও, তারা কয়েক চতুর্থাংশের মধ্যে থাকবে। গড় ফার্ম বছরে 42% হারে বৃদ্ধি পাচ্ছে, ডেটা-কেন্দ্রিক সংস্থাগুলি তার চেয়ে দ্বিগুণ হারে বৃদ্ধি পাচ্ছে, যদি বেশি না হয়।


MinIO ডেটাপড রেফারেন্স আর্কিটেকচারটি প্রায় যেকোনো স্কেল অর্জনের জন্য বিভিন্ন উপায়ে স্ট্যাক করা যেতে পারে - প্রকৃতপক্ষে আমাদের কাছে এমন গ্রাহক রয়েছে যারা এই ব্লুপ্রিন্টটি তৈরি করেছেন - সমস্ত পথ একটি এক্সাবাইটের অতীত এবং একাধিক হার্ডওয়্যার বিক্রেতাদের সাথে। MinIO DataPod একটি এন্ড-টু-এন্ড আর্কিটেকচার অফার করে যা অবকাঠামো প্রশাসকদের বিভিন্ন ধরনের AI এবং ML কাজের চাপের জন্য সাশ্রয়ী সমাধান স্থাপন করতে সক্ষম করে। এখানে আমাদের স্থাপত্যের যুক্তি রয়েছে।

AI এর জন্য আলাদা করা স্টোরেজ এবং কম্পিউট প্রয়োজন

এআই ওয়ার্কলোড, বিশেষ করে জেনারেটিভ এআই, সহজাতভাবে গণনার জন্য জিপিইউ প্রয়োজন। তারা অবিশ্বাস্য থ্রুপুট, মেমরি ব্যান্ডউইথ এবং সমান্তরাল প্রক্রিয়াকরণ ক্ষমতা সহ দর্শনীয় ডিভাইস। দ্রুত এবং দ্রুততর হয়ে উঠছে এমন GPUগুলির সাথে তাল মিলিয়ে চলার জন্য উচ্চ-গতির স্টোরেজ প্রয়োজন৷ এটি বিশেষভাবে সত্য যখন প্রশিক্ষণের ডেটা মেমরিতে ফিট করতে পারে না এবং প্রশিক্ষণ লুপগুলিকে স্টোরেজের জন্য আরও কল করতে হয়। তদুপরি, উদ্যোগগুলির কর্মক্ষমতার চেয়ে বেশি প্রয়োজন, তাদের সুরক্ষা, প্রতিলিপি এবং স্থিতিস্থাপকতাও প্রয়োজন।


এন্টারপ্রাইজ স্টোরেজ প্রয়োজনীয়তা দাবি করে যে আর্কিটেকচারটি কম্পিউট থেকে স্টোরেজ সম্পূর্ণভাবে আলাদা করে। এটি কম্পিউটের থেকে স্বতন্ত্রভাবে স্টোরেজ স্কেল করার অনুমতি দেয় এবং প্রদত্ত যে স্টোরেজ বৃদ্ধি সাধারণত কম্পিউট বৃদ্ধির চেয়ে এক বা একাধিক মাত্রার বেশি, এই পদ্ধতিটি উচ্চতর ক্ষমতা ব্যবহারের মাধ্যমে সর্বোত্তম অর্থনীতি নিশ্চিত করে।

এআই ওয়ার্কলোড একটি ভিন্ন শ্রেণীর নেটওয়ার্কিং দাবি করে

নেটওয়ার্কিং অবকাঠামো 100 গিগাবিট প্রতি সেকেন্ডে (Gbps) ব্যান্ডউইথ লিঙ্কে AI ওয়ার্কলোড স্থাপনার জন্য প্রমিত হয়েছে। আধুনিক দিনের NVMe ড্রাইভগুলি গড়ে 7GBps থ্রুপুট প্রদান করে যা স্টোরেজ সার্ভার এবং GPU কম্পিউট সার্ভারের মধ্যে নেটওয়ার্ক ব্যান্ডউইথকে AI পাইপলাইন এক্সিকিউশন পারফরম্যান্সের জন্য বাধা হয়ে দাঁড়ায়।


Infiniband (IB) এর মতো জটিল নেটওয়ার্কিং সমাধানগুলির সাথে এই সমস্যার সমাধান করার বাস্তব সীমাবদ্ধতা রয়েছে। আমরা সুপারিশ করি যে এন্টারপ্রাইজগুলি বিদ্যমান, ইন্ডাস্ট্রি-স্ট্যান্ডার্ড ইথারনেট-ভিত্তিক সমাধানগুলি (যেমন, টিসিপির উপর HTTP) যেগুলি নিম্নলিখিত কারণে GPU-গুলির জন্য উচ্চ থ্রুপুটে ডেটা সরবরাহ করার জন্য বাক্সের বাইরে কাজ করে:


  • অনেক বড় এবং উন্মুক্ত ইকোসিস্টেম
  • নেটওয়ার্ক অবকাঠামো খরচ হ্রাস
  • উচ্চ আন্তঃসংযোগ গতি (800 GbE এবং তার পরে) RDMA ওভার ইথারনেট সমর্থনের সাথে (যেমন: RoCEv2)
  • ইথারনেট স্থাপন, পরিচালনা এবং পর্যবেক্ষণে বিদ্যমান দক্ষতা এবং সরঞ্জামগুলি পুনরায় ব্যবহার করুন
  • জিপিইউ থেকে স্টোরেজ সার্ভার কমিউনিকেশনের চারপাশে উদ্ভাবন ইথারনেট ভিত্তিক সমাধানে ঘটছে

এআই ডিমান্ড অবজেক্ট স্টোরেজের প্রয়োজনীয়তা

এটা কোন কাকতালীয় ঘটনা নয় যে পাবলিক ক্লাউডে AI ডেটা অবকাঠামো সবই অবজেক্ট স্টোরের উপরে তৈরি করা হয়। বা এটি একটি কাকতালীয় নয় যে প্রতিটি প্রধান ভিত্তি মডেল একটি বস্তুর দোকানে প্রশিক্ষিত হয়েছিল। এটি একটি ফাংশন যে POSIX AI দ্বারা প্রয়োজনীয় ডেটা স্কেলে কাজ করার জন্য খুব চ্যাট - লিগ্যাসি ফাইলারদের কোরাস যা দাবি করবে তা সত্ত্বেও।


একই আর্কিটেকচার যা পাবলিক ক্লাউডে AI সরবরাহ করে তা প্রাইভেট ক্লাউডে এবং স্পষ্টতই হাইব্রিড ক্লাউডে প্রয়োগ করা উচিত। অবজেক্ট স্টোরগুলি বিভিন্ন ডেটা ফরম্যাট এবং বিশাল পরিমাণে অসংগঠিত ডেটা পরিচালনা করতে পারদর্শী এবং কর্মক্ষমতার সাথে আপোস না করে ক্রমবর্ধমান ডেটা মিটমাট করার জন্য অনায়াসে স্কেল করতে পারে। তাদের ফ্ল্যাট নেমস্পেস এবং মেটাডেটা ক্ষমতা দক্ষ ডেটা ম্যানেজমেন্ট এবং প্রসেসিং সক্ষম করে যা বড় ডেটাসেটে দ্রুত অ্যাক্সেসের প্রয়োজন AI টাস্কগুলির জন্য অত্যন্ত গুরুত্বপূর্ণ।


যেহেতু উচ্চ-গতির GPU গুলি বিকশিত হয় এবং নেটওয়ার্ক ব্যান্ডউইথ 200/400/800 Gbps এবং তার পরেও মানসম্মত হয়, আধুনিক অবজেক্ট স্টোরগুলিই একমাত্র সমাধান যা পারফরম্যান্স SLA এবং AI ওয়ার্কলোডের স্কেল পূরণ করে৷


সফ্টওয়্যার সংজ্ঞায়িত সবকিছু

আমরা জানি যে জিপিইউগুলি শোয়ের তারকা এবং তারা হার্ডওয়্যার। কিন্তু এমনকি এনভিডিয়া আপনাকে বলবে গোপন সস হল CUDA। তবে চিপের বাইরে যান এবং অবকাঠামো বিশ্ব ক্রমবর্ধমান সফ্টওয়্যার-সংজ্ঞায়িত হচ্ছে। স্টোরেজের চেয়ে এটি কোথাও সত্য নয়৷ নিম্নলিখিত কারণে সফ্টওয়্যার-সংজ্ঞায়িত স্টোরেজ সমাধানগুলি স্কেলেবিলিটি, নমনীয়তা এবং ক্লাউড ইন্টিগ্রেশনের জন্য অপরিহার্য, নিম্নলিখিত কারণে প্রথাগত অ্যাপ্লায়েন্স-ভিত্তিক মডেলগুলিকে ছাড়িয়ে যায়:


  • ক্লাউড সামঞ্জস্যতা : সফ্টওয়্যার-সংজ্ঞায়িত স্টোরেজ ক্লাউড অপারেশনগুলির সাথে সারিবদ্ধ করে, একাধিক ক্লাউড জুড়ে চলতে পারে না এমন যন্ত্রপাতিগুলির বিপরীতে।


  • কন্টেইনারাইজেশন : ক্লাউড-নেটিভ সুবিধা হারানো এবং কুবারনেটস অর্কেস্ট্রেশন প্রতিরোধ করে অ্যাপ্লায়েন্সগুলি কন্টেইনারাইজ করা যাবে না।


  • হার্ডওয়্যার নমনীয়তা : সফ্টওয়্যার-সংজ্ঞায়িত স্টোরেজ বিস্তৃত হার্ডওয়্যারকে সমর্থন করে, প্রান্ত থেকে কোর পর্যন্ত, বিভিন্ন আইটি পরিবেশকে মিটমাট করে।


  • অভিযোজিত পারফরম্যান্স : সফ্টওয়্যার-সংজ্ঞায়িত স্টোরেজ অতুলনীয় নমনীয়তা প্রদান করে, বিভিন্ন চিপসেট জুড়ে দক্ষতার সাথে বিভিন্ন ক্ষমতা এবং কর্মক্ষমতা প্রয়োজনীয়তা পরিচালনা করে।


এক্সাবাইট স্কেলে, সরলতা এবং একটি ক্লাউড-ভিত্তিক অপারেটিং মডেল অত্যন্ত গুরুত্বপূর্ণ। অবজেক্ট স্টোরেজ, একটি সফ্টওয়্যার-সংজ্ঞায়িত সমাধান হিসাবে, কমোডিটি অফ-দ্য-শেল্ফ (COTS) হার্ডওয়্যার এবং যে কোনও গণনা প্ল্যাটফর্মে নির্বিঘ্নে কাজ করা উচিত, তা বেয়ার মেটাল, ভার্চুয়াল মেশিন বা পাত্রে হোক না কেন।


অবজেক্ট স্টোরেজের জন্য কাস্টম-বিল্ট হার্ডওয়্যার অ্যাপ্লায়েন্সগুলি প্রায়শই ব্যয়বহুল হার্ডওয়্যার এবং জটিল সমাধান সহ খারাপভাবে ডিজাইন করা সফ্টওয়্যারগুলির জন্য ক্ষতিপূরণ দেয়, যার ফলে মালিকানার উচ্চ মোট খরচ হয় (TCO)।

AI এর জন্য MinIO DataPOD হার্ডওয়্যার স্পেসিফিকেশন:

এআই উদ্যোগের জন্য MinIO ব্যবহারকারী এন্টারপ্রাইজ গ্রাহকরা এক্সাবাইট স্কেল ডেটা পরিকাঠামো 100PiB-এর পুনরাবৃত্তিযোগ্য ইউনিট হিসেবে তৈরি করে। এটি অবকাঠামো প্রশাসকদের স্থাপনা, রক্ষণাবেক্ষণ এবং স্কেলিং প্রক্রিয়া সহজ করতে সাহায্য করে কারণ এআই ডেটা সময়ের সাথে সাথে দ্রুতগতিতে বৃদ্ধি পায়। নীচে একটি 100PiB স্কেলের ডেটা অবকাঠামো তৈরির জন্য উপকরণের বিল (BOM) দেওয়া হল।


ক্লাস্টার স্পেসিফিকেশন


কম্পোনেন্ট

পরিমাণ

র্যাকের মোট সংখ্যা

30

স্টোরেজ সার্ভারের মোট সংখ্যা

330

র্যাক প্রতি স্টোরেজ সার্ভারের মোট সংখ্যা

11

TOR সুইচের মোট সংখ্যা

60

মেরুদণ্ডের সুইচের মোট সংখ্যা

10

ইরেজার কোড স্ট্রাইপ সাইজ

10

ইরেজার কোড সমতা

4


একক রাক স্পেসিফিকেশন


কম্পোনেন্ট

বর্ণনা

পরিমাণ

তাক ঘের

42U/45U স্লট রাক

1

স্টোরেজ সার্ভার

2U ফর্ম ফ্যাক্টর

11

র্যাক সুইচ শীর্ষ

লেয়ার 2 সুইচ

2

ব্যবস্থাপনা সুইচ

সম্মিলিত স্তর 2 এবং স্তর 3

1

নেটওয়ার্ক কেবল

AOC তারের

30-40

শক্তি

RPDU এর সাথে ডুয়াল পাওয়ার সাপ্লাই

17kW - 20kW


স্টোরেজ সার্ভার স্পেসিফিকেশন

কম্পোনেন্ট

স্পেসিফিকেশন

সার্ভার

2U, একক সকেট

সিপিইউ

64 কোর, 128 * PCIe 4.0 লেন

স্মৃতি

256 জিবি

নেটওয়ার্ক

ডুয়াল পোর্ট, 200gbe NIC

ড্রাইভ বেস

24 হট-সোয়াপ 2.5" U.2 NVMe

ড্রাইভ করে

30TB * 24 NVMe

শক্তি

1600W অপ্রয়োজনীয় পাওয়ার সাপ্লাই

মোট কাঁচা ক্ষমতা

720 টিবি


স্টোরেজ সার্ভার রেফারেন্স


ডেল : পাওয়ারএজ R7615 র্যাক সার্ভার


HPE : HPE ProLiant DL345 Gen11


সুপারমাইক্রো : A+ সার্ভার 2114S-WN24RT


নেটওয়ার্ক সুইচ স্পেসিফিকেশন

কম্পোনেন্ট

স্পেসিফিকেশন


র্যাক (TOR) স্যুইচের শীর্ষ

32 * 100GbE QSFP 28 পোর্ট


মেরুদণ্ড সুইচ

64 * 100GbE QSFP 28 পোর্ট


তারের

100G QSFP 28 AOC


শক্তি

প্রতি সুইচ 500 ওয়াট



দাম

MinIO একাধিক গ্রাহকের সাথে এই আর্কিটেকচারটি যাচাই করেছে এবং অন্যরা প্রতি মাসে প্রতি টেরাবাইট প্রতি নিম্নোক্ত গড় মূল্য দেখতে আশা করবে। এটি একটি গড় রাস্তার মূল্য এবং প্রকৃত মূল্য কনফিগারেশন এবং হার্ডওয়্যার বিক্রেতার সম্পর্কের উপর নির্ভর করে পরিবর্তিত হতে পারে।


স্কেল

স্টোরেজ হার্ডওয়্যারের মূল্য **(প্রতি টিবি/মাস)**

MinIO সফ্টওয়্যার মূল্য **(প্রতি টিবি/মাস)**

100PiB

$1.50

$3.54


AI-এর জন্য বিক্রেতা নির্দিষ্ট টার্নকি হার্ডওয়্যার অ্যাপ্লায়েন্সের ফলে উচ্চ TCO হবে এবং এক্সাবাইট স্কেলে বড় ডেটা AI উদ্যোগের জন্য ইউনিট অর্থনীতির দৃষ্টিকোণ থেকে মাপযোগ্য নয়।

উপসংহার

সমস্ত AI/ML কাজের চাপের জন্য TCO উদ্দেশ্য পূরণ করার সময় এক্সাবাইট স্কেলে ডেটা ইনফ্রাস্ট্রাকচার সেটআপ জটিল এবং সঠিক হওয়া কঠিন হতে পারে। MinIO-এর DataPOD অবকাঠামোর ব্লুপ্রিন্ট অবকাঠামো প্রশাসকদের জন্য অত্যন্ত স্কেলযোগ্য, কার্যকরী সাশ্রয়ী S3 সামঞ্জস্যপূর্ণ MinIO এন্টারপ্রাইজ অবজেক্ট স্টোর সহ শেলফ হার্ডওয়্যারের বাইরে প্রয়োজনীয় পণ্য সেট আপ করা সহজ এবং সরল করে তোলে যার ফলে সামগ্রিকভাবে বাজারের সময় এবং দ্রুত সময়ের মূল্যের উন্নতি হয়। এন্টারপ্রাইজ ল্যান্ডস্কেপের মধ্যে প্রতিষ্ঠান জুড়ে এআই উদ্যোগ।