মেশিন লার্নিং এমন মডেল তৈরির উপর কেন্দ্রীভূত হয় যা সঠিকভাবে ভবিষ্যদ্বাণী করে। মূল্যায়ন মেট্রিক্স একটি মডেলের কার্যকারিতা পরিমাপ করার একটি উপায় অফার করে, যা আমাদের পারফরম্যান্স ফলাফলের উপর ভিত্তি করে অ্যালগরিদম পরিমার্জন বা পরিবর্তন করতে দেয়।
"সম্ভাবনা" ধারণাটি এই অনেক মেট্রিক্সের কেন্দ্রবিন্দু। এটি পরিমাপ করে যে একটি মডেলের ভবিষ্যদ্বাণী কতটা ভালোভাবে পর্যবেক্ষণ করা ডেটার সাথে সামঞ্জস্যপূর্ণ। তাই, এটি মডেল প্রশিক্ষণ এবং মূল্যায়নে একটি গুরুত্বপূর্ণ ভূমিকা পালন করে।
উচ্চ সম্ভাবনা সহ একটি মডেল, উদাহরণস্বরূপ, পরামর্শ দেয় যে প্রদত্ত মডেলের অনুমানের অধীনে পর্যবেক্ষণ করা ডেটা আরও সম্ভাব্য।
TensorFlow এবং PyTorch-এর মতো প্রযুক্তি সরঞ্জামগুলি প্রায়শই সম্ভাবনা-ভিত্তিক মেট্রিক্স ব্যবহার করে, বিশেষ করে শ্রেণীবিভাগ বা ক্রম পূর্বাভাসের মতো কাজগুলিতে। এই ধরনের সরঞ্জামগুলি, এই মেট্রিক্সের জন্য তৈরি ফাংশন এবং লাইব্রেরিগুলির সাথে সজ্জিত, মডেল মূল্যায়নের কাজটিকে অ্যাক্সেসযোগ্য এবং অত্যন্ত দক্ষ করে তোলে।
সম্ভাব্যতা এবং এর সাথে সম্পর্কিত মেট্রিক্স বোঝা মেশিন লার্নিংয়ে যে কারো জন্য অত্যাবশ্যক। এটি আমাদের মডেল মূল্যায়ন এবং উন্নতির ভিত্তি তৈরি করতে দেয়।
নীচে, আমরা তিনটি মূল মূল্যায়নের মেট্রিকগুলিকে ঘনিষ্ঠভাবে দেখব যে তারা কীভাবে কাজ করে এবং মেশিন লার্নিং-এ একে অপরের সাথে সম্পর্কিত।
ক্রসেনট্রপি সম্ভাব্যতার দুটি সেটের মধ্যে পার্থক্য মূল্যায়ন করে, প্রায়শই একটি মডেলের পূর্বাভাসিত ফলাফলের সাথে বাস্তব ডেটা প্যাটার্নগুলিকে জুক্সটাপোজ করে। গাণিতিকভাবে, p
এবং q
বিচ্ছিন্ন বণ্টনের জন্য, ক্রসেন্ট্রপি H(p, q)
দ্বারা দেওয়া হয়:
H(p, q) = -\sum p(x) \log(q(x))
যেখানে \( p(x) \) হল একটি ঘটনা x
ঘটার সত্যিকারের সম্ভাব্যতা, এবং q(x)
হল মডেল অনুযায়ী একই ঘটনার আনুমানিক সম্ভাব্যতা।
এটি প্রধানত শ্রেণিবিন্যাসের সমস্যাগুলিতে প্রয়োগ করা হয়, বিশেষ করে এমন পরিস্থিতিতে যেখানে আউটপুট একাধিক শ্রেণীর অন্তর্গত হতে পারে। এটি ব্যবহার করা হয় কারণ এটি একটি মডেলের ভবিষ্যদ্বাণী প্রকৃত ফলাফল থেকে কত দূরে তার একটি পরিষ্কার পরিমাপ প্রদান করে। ক্রসেন্ট্রপি যত কম হবে, মডেলের ভবিষ্যদ্বাণীগুলি সত্য মানগুলির সাথে সারিবদ্ধ হবে তত ভাল৷
বেশ কিছু সফ্টওয়্যার লাইব্রেরি ক্রসেনট্রপি জড়িত গণনা পরিচালনা করার জন্য সজ্জিত। লক্ষণীয়ভাবে:
tf.nn.softmax_cross_entropy_with_logits
এর মত ফাংশন প্রদান করে যা শ্রেণীবিভাগের সমস্যার জন্য সরাসরি ক্রসেন্ট্রপি গণনা করে।
torch.nn.CrossEntropyLoss
এর মতো ফাংশনগুলির সাথে একই ধরনের ক্ষমতা প্রদান করে, যা বহু-শ্রেণীর শ্রেণীবিভাগের কাজের জন্য উপযুক্ত।
log_loss
ফাংশন ব্যবহার করে ক্রসেন্ট্রপির সাথে ঘনিষ্ঠভাবে সম্পর্কিত। লগারিদমিক ক্ষতির জন্য সংক্ষিপ্ত লগলোস, মিথ্যা শ্রেণীবিভাগকে শাস্তি প্রদান করে একটি শ্রেণীবিভাগের যথার্থতা পরিমাপ করে। সত্য লেবেল y
এবং পূর্বাভাসিত সম্ভাব্যতা p
সহ একটি বাইনারি শ্রেণীবিভাগের জন্য, লগলস দেওয়া হয়:
L(y, p) = -y \log(p) - (1 - y) \log(1 - p)
মূলত, লগলস হল সত্যিকারের লেবেল এবং বাইনারি শ্রেণীবিভাগ সমস্যার জন্য ভবিষ্যদ্বাণীগুলির মধ্যে ক্রসেন্ট্রপি। মাল্টি-ক্লাস শ্রেণীবিভাগে প্রসারিত হলে, লগলস প্রতিটি শ্রেণীর জন্য ক্রসেন্ট্রপি মানগুলিকে যোগ করে, যা দুটি মেট্রিক্সকে ঘনিষ্ঠভাবে সম্পর্কিত করে।
এটি প্রধানত বাইনারি এবং মাল্টি-ক্লাস শ্রেণীবিভাগ সমস্যায় নিযুক্ত করা হয়। প্রকৃত লেবেল থেকে তারা কতটা বিচ্যুত তার উপর ভিত্তি করে ভবিষ্যদ্বাণীগুলির অনিশ্চয়তা পরিমাপ করার ক্ষমতার মধ্যে এর শক্তি নিহিত।
একটি নিখুঁত মডেলের লগলস 0 থাকবে, যদিও অনুশীলনে, মানগুলি এর চেয়ে বেশি হতে থাকে।
সফ্টওয়্যার লাইব্রেরির একটি হোস্ট আমাদের লগলস গণনা করতে দেয়:
স্কিট-লার্ন । একটি বহুল ব্যবহৃত মেশিন লার্নিং লাইব্রেরি হিসাবে, scikit-learn log_loss
ফাংশন অফার করে, যা বাইনারি এবং মাল্টি-ক্লাস শ্রেণীবিন্যাস উভয় ক্ষেত্রেই পারদর্শী।
টেনসরফ্লো এবং পাইটর্চ। যদিও এই ফ্রেমওয়ার্কগুলি প্রধানত নিউরাল নেটওয়ার্ক এবং গভীর শিক্ষার উপর ফোকাস করে, তারা শ্রেণীবিভাগের কাজের জন্য ক্রসসেনট্রপি লস ফাংশন ব্যবহার করার সময় সহজাতভাবে লগলস গণনা করে।
LightGBM এবং XGBoost। এই গ্রেডিয়েন্ট-বুস্টিং ফ্রেমওয়ার্কগুলি, টেবুলার ডেটা প্রতিযোগিতায় তাদের উচ্চ কর্মক্ষমতার জন্য পরিচিত, এছাড়াও লগলস গণনা করার কার্যকারিতা রয়েছে, যা শ্রেণিবিন্যাস চ্যালেঞ্জগুলিতে মডেলের কার্যকারিতা মূল্যায়ন করার সময় বিশেষত কার্যকর।
এটি সম্ভাব্যতা বন্টন বা সম্ভাব্যতা মডেল একটি নমুনার ভবিষ্যদ্বাণী কতটা ভাল তার একটি পরিমাপ।
দ্বারা প্রদত্ত:
Perplexity(P) = 2^{H(P)}
যেখানে H(P)
হল P
ডিস্ট্রিবিউশনের ক্রসসেন্ট্রপি, বিভ্রান্তি কার্যকরভাবে একটি মডেল মনে করে যে প্রতিটি সিদ্ধান্তের পয়েন্টে রয়েছে পছন্দের ওজনযুক্ত গড় সংখ্যার প্রতিনিধিত্ব করে।
ক্রসেন্ট্রপির প্রেক্ষাপটে, একটি উচ্চতর ক্রসেন্ট্রপি মান একটি উচ্চতর বিভ্রান্তির সাথে মিলে যায়, যা নির্দেশ করে যে মডেলটি তার ভবিষ্যদ্বাণী সম্পর্কে আরও অনিশ্চিত।
Perplexity-এর সবচেয়ে উল্লেখযোগ্য প্রয়োগ হল ভাষার মডেলে, যেখানে এটি পরিমাপ করে যে মডেল কতটা ভালোভাবে শব্দের ক্রম অনুমান করে। নিম্ন বিভ্রান্তি সহ একটি মডেলকে উচ্চতর বলে গণ্য করা হয় কারণ এটি কম গড় শাখার কারণগুলিকে নির্দেশ করে, বা সহজ কথায়, এটি একটি অনুক্রমের পরবর্তী শব্দ সম্পর্কে আরও নিশ্চিত।
ভাষার মডেলগুলি ছাড়াও, বিভ্রান্তি অন্যান্য সম্ভাব্য মডেলগুলিতেও একটি প্রাসঙ্গিক মেট্রিক হতে পারে যেখানে অনুক্রম বা বিতরণের উপর পূর্বাভাসের গুণমান অত্যন্ত গুরুত্বপূর্ণ।
বেশ কিছু সরঞ্জাম এবং প্ল্যাটফর্ম বিভ্রান্তির গণনা এবং ব্যাখ্যায় সহায়তা করে:
NLTK । ন্যাচারাল ল্যাঙ্গুয়েজ টুলকিট সম্ভাব্য ভাষার মডেল তৈরির জন্য ইউটিলিটিগুলি প্রদান করে এবং এই মডেলগুলির মূল্যায়নের জন্য বিভ্রান্তি গণনা করে।
টেনসরফ্লো এবং পাইটর্চ। গভীর শিক্ষা-ভিত্তিক ভাষার মডেলের জন্য, এই উভয় কাঠামোই ক্রসেন্ট্রপি গণনা করার কার্যকারিতা প্রদান করে, যা পরবর্তীতে উপরের সূত্রটি ব্যবহার করে বিভ্রান্তিতে অনুবাদ করা যেতে পারে।
জেনসিম । বেশিরভাগ টপিক মডেলিংয়ের জন্য পরিচিত, জেনসিমে বিভ্রান্তি গণনা করার পদ্ধতিও রয়েছে, বিশেষত উপযোগী যখন উত্পন্ন বিষয়গুলির সমন্বয় মূল্যায়ন করা হয়।
ক্রসসেনট্রপি, লগলস, এবং বিভ্রান্তি হল তথ্য তত্ত্ব এবং সম্ভাব্য মডেলিংয়ের মূল মেট্রিক্স। তাদের মূল উদ্দেশ্য হল ভবিষ্যদ্বাণীর গুণমান মূল্যায়ন করা, তা শ্রেণীবিভাগ বা সম্ভাব্যতা বন্টন অনুমানের জন্যই হোক। উচ্চ স্তরে:
একটি সার্বজনীন মেট্রিক হিসাবে, ক্রসেন্ট্রপি সমস্যাগুলির জন্য উপযুক্ত যেখানে লক্ষ্য একটি নির্দিষ্ট সম্ভাব্যতার বন্টন আনুমানিক বা মেলে। এটি বহু-শ্রেণীর শ্রেণীবিভাগের কাজগুলিতে জ্বলজ্বল করে। উদাহরণগুলির মধ্যে রয়েছে চিত্রের শ্রেণিবিন্যাস যেখানে প্রতিটি চিত্র বিভিন্ন বিভাগের একটির অন্তর্ভুক্ত হতে পারে, বা রোগীর লক্ষণগুলির উপর ভিত্তি করে রোগীর কী ধরণের রোগ হতে পারে তার ভবিষ্যদ্বাণী করা।
শ্রেণীবিভাগের জন্য উপযোগী, লগলস বাইনারি এবং বহু-শ্রেণীর সমস্যার জন্য মেট্রিক হয়ে ওঠে, আত্মবিশ্বাসী ভুল ভবিষ্যদ্বাণীগুলিকে ব্যাপকভাবে শাস্তি দেয়। এর শক্তি সঠিক সম্ভাব্য ভবিষ্যদ্বাণীগুলির প্রতি সংবেদনশীলতার মধ্যে রয়েছে।
উদাহরণস্বরূপ, স্প্যাম সনাক্তকরণে (স্প্যাম বা স্প্যাম নয়), গ্রাহক মন্থন পূর্বাভাস (মন্থন করবে বা মন্থন করবে না), বা প্রদত্ত লেনদেন জালিয়াতি হলে ভবিষ্যদ্বাণী করা।
অবশেষে, প্রধানত ভাষার মডেলিংয়ে ব্যবহৃত হয়, বিভ্রান্তি মূল্যায়ন করে যে একটি মডেল কতটা ভালোভাবে অনুক্রমের পূর্বাভাস দেয়। নিম্ন মানগুলি এমন একটি মডেলকে নির্দেশ করে যা তার অনুক্রমিক ভবিষ্যদ্বাণীগুলির বিষয়ে আরও নিশ্চিত৷ এটি পাঠ্য তৈরির কাজ, মেশিন অনুবাদ বা বক্তৃতা স্বীকৃতির জন্য ব্যবহার করা যেতে পারে, যেখানে মডেলটি একটি ক্রমানুসারে পরবর্তী শব্দ বা বাক্যাংশের পূর্বাভাস দেয়।
যদিও তিনটি মেট্রিক্স সম্ভাব্য মডেলের মূল্যায়নের সাথে কাজ করে, তাদের প্রযোজ্যতা টাস্কের প্রকৃতির উপর ভিত্তি করে ভিন্ন হয়ে যায়: বন্টন মিল, শ্রেণীবিভাগ, বা ক্রম পূর্বাভাস।
একজন অভিজ্ঞ মেশিন লার্নিং পেশাদার মডেল পারফরম্যান্সের সবচেয়ে তথ্যপূর্ণ মূল্যায়ন নিশ্চিত করার জন্য কাজের জন্য সবচেয়ে উপযুক্ত মেট্রিক নির্বাচন করে।
ক্রসসেনট্রপি, লগলস এবং বিভ্রান্তির মতো মূল্যায়নের মেট্রিক্সের সূক্ষ্মতাগুলি সনাক্ত করা মেশিন লার্নিং প্রকল্পগুলিতে জ্ঞাত সিদ্ধান্ত গ্রহণকে সরাসরি প্রভাবিত করে। এই মেট্রিক্সগুলির প্রত্যেকটি, তাদের নিজস্ব স্বতন্ত্র বৈশিষ্ট্য এবং ব্যবহার সহ, মূলত ভবিষ্যদ্বাণী মডেলগুলির নির্ভুলতা এবং বিশ্বস্ততাকে প্রভাবিত করে।
ML-এ, টেনসরফ্লো, স্কিট-লার্ন এবং এনএলটিকে-এর মতো প্ল্যাটফর্মগুলি ব্যবহার করা মেট্রিক্সের গণনাকে সহজ করে তোলে এবং মডেলের মূল্যায়ন উন্নত করে। সর্বদা নিশ্চিত করুন যে নির্বাচিত মেট্রিক সেরা ফলাফলের জন্য প্রকল্পের লক্ষ্যগুলির সাথে সারিবদ্ধ।
অবশ্যই, আপনার অভ্যস্ত হিসাবে সুপরিচিত সরঞ্জামগুলি প্রয়োগ করা সহজ, তবে সত্যিকার অর্থে সেগুলি বোঝা শেষ পর্যন্ত আরও উপকারী হতে পারে। শিখতে থাকুন এবং আপনার মুখোমুখি প্রতিটি কাজের জন্য সঠিক মেট্রিক বেছে নিন।