প্রথমে আমার টুইটারে সাবস্ক্রাইব করুন, আমি প্রযুক্তি বিষয়ক টুইট করি
সিরিজে আরও একটি স্পিডরান, চলুন গোওও
আমি শুধু আপনার উপর রিইনফোর্সমেন্ট লার্নিং (RL) মেম ব্যবহার করেছি:
এটা কি একটি টোপ ছিল.. omg..
তাহলে, মেম-কেলভিনের পক্ষে আরএল কী তা শেখা কেন কঠিন? কারণ তিনি ধারণাটি বোঝার পরিবর্তে RL এর বাস্তবায়ন শিখতে চান, সে কারণেই মেম-কেলভিন!
আপনি যখন একটি নতুন জিনিস, টুল বা প্রযুক্তি বা অন্য কিছু শিখেন — আপনি এটির বাস্তবায়ন দিয়ে শুরু করেন না, আপনি ধারণা, ধারণা এবং টুলটি সমাধান করে এমন সমস্যাগুলি দিয়ে শুরু করেন!
ও কেলভিন, এখানে আপনি যান: রিইনফোর্সমেন্ট লার্নিং (RL) বোঝার জন্য — এমন একটি ভিডিও গেম খেলার কথা ভাবুন যেখানে আপনি সঠিক পদক্ষেপগুলি করার জন্য পয়েন্ট অর্জন করেন।
রিইনফোর্সমেন্ট লার্নিং এরকম - একটি প্রোগ্রাম সিদ্ধান্ত নেওয়ার মাধ্যমে শেখে এবং তার কর্মের উপর ভিত্তি করে পুরস্কার বা জরিমানা পায়
এটি ছিল রিইনফোর্সমেন্ট লার্নিং-এ START-WITH-আইডিয়াস নীতি প্রয়োগ করার একটি উদাহরণ। কিন্তু আমি প্রতিশ্রুতি দিয়েছিলাম কিভাবে 52 সেকেন্ডে পুরো ML শিখতে হয়...
52 সেকেন্ডের মধ্যে ML শিখতে আপনি ML ধারণাগুলি শিখবেন, বাস্তবায়ন নয় , তারপর আপনি PyTorch বা আপনার পছন্দের লাইব্রেরি নামটিতে গুগল (বা GPT) বাস্তবায়ন করুন, যাইহোক এটি পরের বছরে পরিবর্তন হতে চলেছে এবং এটি ঠিক আছে, ধারণাগুলি থাকবে অনেক দীর্ঘ সময়ের জন্য একই - ধারণা জন্য যান!
তত্ত্বাবধানে শেখার ক্ষেত্রে, উত্তর সহ উদাহরণ ব্যবহার করে একটি প্রোগ্রাম শেখানো হয় (লেবেলযুক্ত ডেটা বলা হয়)। এটি প্রোগ্রামটিকে উদাহরণ এবং উত্তরগুলির মধ্যে সংযোগ শিখতে সাহায্য করে, তাই এটি নতুন উদাহরণগুলির উত্তরগুলি অনুমান করতে পারে যা এটি আগে দেখেনি৷
অ্যালগরিদম এবং সমস্যা সমাধানের জন্য: বাড়ির দামের পূর্বাভাস দেওয়া (লিনিয়ার রিগ্রেশন), একজন গ্রাহক একটি পণ্য কিনবেন কিনা তা সিদ্ধান্ত নেওয়া (সিদ্ধান্ত গাছ)
এখানে, প্রোগ্রামটি উত্তর ছাড়া উদাহরণগুলি দেখে (লেবেলবিহীন ডেটা) এবং তাদের মধ্যে নিদর্শন বা গোষ্ঠীগুলি খুঁজে বের করার চেষ্টা করে। এটি অনুরূপ আইটেমগুলিকে একত্রে গোষ্ঠীবদ্ধ করা বা ডেটা বর্ণনা করার জন্য প্রয়োজনীয় তথ্যের পরিমাণ হ্রাস করার মতো কাজগুলিতে সহায়তা করতে পারে।
অ্যালগরিদম এবং সমস্যা সমাধানের জন্য: একই ধরনের সঙ্গীত স্বাদের লোকেদেরকে গোষ্ঠীবদ্ধ করা (কে-মানে ক্লাস্টারিং), খুব বেশি তথ্য না হারিয়ে চিত্রগুলি সংকুচিত করা (প্রধান উপাদান বিশ্লেষণ)
শক্তিবৃদ্ধি শেখার ক্ষেত্রে, প্রোগ্রামটি কিছু চেষ্টা করে এবং পুরস্কার বা জরিমানা আকারে প্রতিক্রিয়া পাওয়ার মাধ্যমে সিদ্ধান্ত নিতে শেখে। লক্ষ্য হল সময়ের সাথে আরও ভাল সিদ্ধান্ত নেওয়া এবং আরও কার্যকরভাবে সমস্যাগুলি সমাধান করা।
অ্যালগরিদম এবং সমস্যা সমাধানের জন্য: একটি রোবটকে হাঁটতে শেখানো (কিউ-লার্নিং), দাবা খেলার জন্য একটি প্রোগ্রাম প্রশিক্ষণ দেওয়া (পলিসি গ্রেডিয়েন্ট পদ্ধতি)
প্রোগ্রামটিকে আরও ভালভাবে শিখতে সাহায্য করার জন্য এটি কাঁচা ডেটা থেকে গুরুত্বপূর্ণ তথ্য (বৈশিষ্ট্য) বেছে নেওয়ার প্রক্রিয়া। কখনও কখনও, এর মধ্যে রয়েছে বিশেষজ্ঞ জ্ঞান এবং সৃজনশীলতা ব্যবহার করে নতুন বৈশিষ্ট্য তৈরি করা।
উদাহরণ: একটি গাছের প্রজাতি সনাক্ত করতে সাহায্য করার জন্য একটি পাতার দৈর্ঘ্য এবং প্রস্থ ব্যবহার করা
একটি মেশিন লার্নিং মডেল কতটা ভাল কাজ করছে তা পরীক্ষা করা গুরুত্বপূর্ণ যে এটি ভালভাবে কাজ করছে কিনা। নির্ভুলতা, নির্ভুলতা, প্রত্যাহার, F1-স্কোর এবং গড় বর্গক্ষেত্র ত্রুটির মতো পরিমাপগুলি প্রায়শই একটি মডেলের কার্যকারিতা পরীক্ষা করতে ব্যবহৃত হয়।
⏲️ 24 সেকেন্ড বাকি, আপনি ভাল যান!
এর ডিপ লার্নিং কভার করা যাক!
এই সত্যিই বিমূর্ত. আপনি কল্পনা করতে পারেন একটি NN-কে ব্রেন-নিউরন হিসাবে কলামে অর্ডার করা হয়েছে এবং একে অপরকে বাম থেকে ডানে বিভিন্ন বল দিয়ে (সংযোগের মাধ্যমে) পিং করছে — যে শক্তি দিয়ে একটি নিউরন (প্রতিটি স্তরে) পিং করা হয় তা পরবর্তী পিংকে সংজ্ঞায়িত করে এবং তাই শেষ ফলাফল। নিজেই
অ্যালগরিদম এবং সমস্যা সমাধানের জন্য: ছবিতে বস্তুর স্বীকৃতি (ফিডফরোয়ার্ড নিউরাল নেটওয়ার্ক), ভাষা অনুবাদ করা (রেডিয়াল বেসিস ফাংশন নেটওয়ার্ক)
আপনি যখন একটি ভুল করেন, আপনি এটি থেকে শিখুন এবং এটি পুনরাবৃত্তি না করার চেষ্টা করুন। ব্যাকপ্রোপগেশন হল একটি প্রোগ্রামের জন্য একই জিনিস করার একটি উপায়।
এটি প্রোগ্রামটিকে বুঝতে সাহায্য করে যে এটি কোথায় ভুল হয়েছে এবং সঠিক উত্তরগুলি খুঁজে পেতে আরও ভাল হতে পারে৷
CNN হল বিশেষ নিউরাল নেটওয়ার্ক যা ছবিগুলির মতো গ্রিডের মতো ডেটা বুঝতে পারে।
তাদের স্তর রয়েছে যা তাদের প্যাটার্ন শিখতে এবং ছবির অংশগুলি যেমন লাইন এবং আকার চিনতে সাহায্য করে।
অ্যালগরিদম এবং সমস্যা সমাধানের জন্য: ফটোতে মুখ সনাক্ত করা (LeNet-5), ছবিতে বিভিন্ন ধরণের প্রাণী সনাক্ত করা (AlexNet, VGG)
আরএনএনগুলি এমন ডেটার সাথে কাজ করার জন্য ডিজাইন করা হয়েছে যা একটি ক্রমানুসারে আসে, যেমন সংখ্যা বা শব্দের একটি সিরিজ।
তারা আগের ইনপুটগুলি মনে রাখতে পারে এবং আরও ভাল সিদ্ধান্ত নিতে সেই তথ্যগুলি ব্যবহার করতে পারে।
অ্যালগরিদম এবং সমস্যা সমাধানের জন্য: স্টক মূল্যের পূর্বাভাস (লং শর্ট-টার্ম মেমরি, LSTM), একটি প্রদত্ত শৈলীর উপর ভিত্তি করে টেক্সট তৈরি করা (গেটেড রিকারেন্ট ইউনিট, GRU)
এটি তখন হয় যখন একটি প্রোগ্রাম মডেল যা ইতিমধ্যে অনেক কিছু শিখেছে সীমিত ডেটা সহ একটি নতুন টাস্কে কাজ করার জন্য সূক্ষ্ম-টিউন করা হয়।
এটি প্রোগ্রামটিকে দ্রুত শিখতে এবং আরও ভাল কার্য সম্পাদন করতে সাহায্য করে কারণ এটি ইতিমধ্যেই এর আগের শিক্ষা থেকে দরকারী জিনিসগুলি জানে৷
উদাহরণ: নির্দিষ্ট ধরণের বিড়াল চিনতে অনেক কুকুরের প্রজাতির (যেমন ResNet) প্রশিক্ষণপ্রাপ্ত মডেল ব্যবহার করা
এই কৌশলগুলি প্রোগ্রামটিকে ডেটা থেকে খুব বেশি শেখা এড়াতে সাহায্য করে, যা অতিরিক্ত ফিটিং এর মতো সমস্যা সৃষ্টি করতে পারে
শেষ হয়েছে: 0 মিনিট, 52 সেকেন্ড
এটি মূলত এটি, এখন যান এবং অ্যালগরিদম এবং আপনি সমাধান করতে চান এমন সমস্যার জন্য আপনার এজেন্ট কেলভিন গুগলিং বাস্তবায়নের প্রশিক্ষণ দিন!
একটি টুল ব্যবহার করা শুরু করতে, আপনি টুলটি সমাধান করে এমন একটি সমস্যা দিয়ে শুরু করুন এবং সমস্যাটি সমাধানের জন্য কী ধারণা(গুলি) ব্যবহার করা হয় তা শিখুন। "কীভাবে একটি টুল দিয়ে কিছু করতে হয়" এর মতো বাস্তবায়ন আপনার মাথায় রাখবেন না, এটি জটিল এবং সবকিছু আপনার মাথায় ফিট হবে না।
ধারণা, গুগল বাস্তবায়ন শিখুন.
5 ~ 10 বার গুগল করার পরে আপনি এটি মুখস্থ করবেন, তারপর প্রযুক্তিটি অপ্রচলিত হয়ে যাবে এবং আপনি এটি ভুলে যাবেন, ঠিক আছে, এটি সব সময় ঘটে
ধারণাগুলি ভুলে যাওয়া কঠিন, সেগুলি দীর্ঘ সময়ের জন্য আপনার স্মৃতিতে ফিট করে
বাই এবং পরবর্তী ড্র্যাগ রেসে দেখা হবে
অক্ষয়ভাবে অপেক্ষা করুন!
আপনি যদি শিক্ষা ব্যবস্থাকে অনুশীলন-প্রথম এবং উপকারী হতে দেখতে চান তাহলে টুইট বার্ডকে অনুসরণ করার কথা ভাবুন <3
যাইহোক আপনি টুইটার অনুসরণ করতে পারেন যদি আপনি কেবল পাঠ্যটি পছন্দ করেন এবং আরও চান বা আপনি সামাজিক নেটওয়ার্কগুলিতে মজা করার আসক্ত হন
অথবা কাউকে অনুসরণ করবেন না এবং কারও কথা শুনবেন না! আপনার নিজের উপায় তৈরি করুন!
আমি আসলে চাই আপনি আমার টুইটগুলি অনুসরণ করুন, এটি কেবল একটি বিক্রয় ছিল।
আমার "43 সেকেন্ডের মধ্যে প্রতিক্রিয়া শিখুন" পরীক্ষা করুন