paint-brush
স্টারবাকস কফির খরচের জন্য কীভাবে আপনার নিজের ব্যক্তিগত চ্যাটজিপিটি মডেলকে প্রশিক্ষণ দেবেনদ্বারা@zhoujieguang
3,158 পড়া
3,158 পড়া

স্টারবাকস কফির খরচের জন্য কীভাবে আপনার নিজের ব্যক্তিগত চ্যাটজিপিটি মডেলকে প্রশিক্ষণ দেবেন

দ্বারা Zhou Jieguang12m2023/06/18
Read on Terminal Reader
Read this story w/o Javascript

অতিদীর্ঘ; পড়তে

এক কাপ স্টারবাক্সের খরচ এবং আপনার দুই ঘন্টা সময়ের সাথে, আপনি আপনার নিজের প্রশিক্ষিত ওপেন সোর্স বড় আকারের মডেলের মালিক হতে পারেন।
featured image - স্টারবাকস কফির খরচের জন্য কীভাবে আপনার নিজের ব্যক্তিগত চ্যাটজিপিটি মডেলকে প্রশিক্ষণ দেবেন
Zhou Jieguang HackerNoon profile picture
0-item
1-item
2-item


এক কাপ স্টারবাক্সের খরচ এবং আপনার দুই ঘণ্টার সময়ের সাথে, আপনি আপনার নিজের প্রশিক্ষিত ওপেন সোর্স বড় আকারের মডেলের মালিক হতে পারেন। আপনার বড় মাপের মডেলকে আপনার সম্পর্কে আরও "বুঝতে" তৈরি করে, মেডিকেল, প্রোগ্রামিং , স্টক ট্রেডিং এবং প্রেমের পরামর্শের মতো বিভিন্ন দক্ষতা বাড়ানোর জন্য বিভিন্ন প্রশিক্ষণ ডেটা দিকনির্দেশ অনুসারে মডেলটি সূক্ষ্মভাবে তৈরি করা যেতে পারে। ওপেন-সোর্স ডলফিনশিডিউলার দ্বারা ক্ষমতাপ্রাপ্ত একটি ওপেন-সোর্স বৃহৎ-স্কেল মডেলের প্রশিক্ষণের চেষ্টা করা যাক!

ভূমিকা

ChatGPT এর গণতন্ত্রীকরণ

চ্যাটজিপিটির জন্ম নিঃসন্দেহে এআই-এর ভবিষ্যতের প্রত্যাশায় আমাদের ভরিয়ে দিয়েছে। এর পরিশীলিত অভিব্যক্তি এবং শক্তিশালী ভাষা বোঝার ক্ষমতা বিশ্বকে অবাক করেছে। যাইহোক, যেহেতু ChatGPT একটি সফ্টওয়্যার হিসাবে একটি পরিষেবা (SaaS) হিসাবে সরবরাহ করা হয়েছে, তাই ব্যক্তিগত গোপনীয়তা ফাঁস এবং কর্পোরেট ডেটা সুরক্ষার সমস্যাগুলি প্রতিটি ব্যবহারকারী এবং কোম্পানির জন্য উদ্বেগের বিষয়। আরও বেশি ওপেন-সোর্স বৃহৎ-স্কেল মডেলগুলি আবির্ভূত হচ্ছে, যা ব্যক্তি এবং সংস্থাগুলির জন্য তাদের নিজস্ব মডেল থাকা সম্ভব করে তুলেছে। যাইহোক, শুরু করা, অপ্টিমাইজ করা এবং ওপেন-সোর্স বৃহৎ-স্কেল মডেলগুলি ব্যবহার করার ক্ষেত্রে প্রবেশের ক্ষেত্রে উচ্চ বাধা রয়েছে, যার ফলে প্রত্যেকের পক্ষে সহজেই সেগুলি ব্যবহার করা কঠিন হয়ে পড়ে৷ এটি মোকাবেলার জন্য, আমরা Apache DolphinScheduler ব্যবহার করি, যা প্রশিক্ষণ, টিউনিং এবং ওপেন-সোর্স বৃহৎ-স্কেল মডেল স্থাপনের জন্য এক-ক্লিক সমর্থন প্রদান করে। এটি প্রত্যেককে খুব কম খরচে এবং প্রযুক্তিগত দক্ষতার সাথে তাদের ডেটা ব্যবহার করে তাদের নিজস্ব বড় আকারের মডেলগুলিকে প্রশিক্ষণ দিতে সক্ষম করে।

কার জন্য? - পর্দার সামনে যে কেউ

আমাদের লক্ষ্য শুধুমাত্র পেশাদার AI ইঞ্জিনিয়ারদের জন্য নয় বরং GPT-এ আগ্রহী যে কেউ এমন একটি মডেল পাওয়ার আনন্দ উপভোগ করতে যা তাদের আরও ভালভাবে "বোঝে"। আমরা বিশ্বাস করি যে প্রত্যেকেরই তাদের নিজস্ব এআই সহকারী গঠন করার অধিকার এবং ক্ষমতা রয়েছে। Apache DolphinScheduler এর স্বজ্ঞাত কর্মপ্রবাহ এটিকে সম্ভব করে তোলে। বোনাস হিসেবে, Apache DolphinScheduler হল GitHub-এ 10,000 টিরও বেশি তারা সহ একটি বড় ডেটা এবং AI শিডিউলিং টুল। এটি অ্যাপাচি সফ্টওয়্যার ফাউন্ডেশনের অধীনে একটি শীর্ষ-স্তরের প্রকল্প, যার অর্থ আপনি এটি বিনামূল্যে ব্যবহার করতে পারেন এবং কোনও বাণিজ্যিক সমস্যা নিয়ে চিন্তা না করেই কোডটি পরিবর্তন করতে পারেন৷


আপনি একজন শিল্প বিশেষজ্ঞ হোন যা আপনার নিজস্ব ডেটা দিয়ে একটি মডেলকে প্রশিক্ষণ দিতে চাইছেন, অথবা একজন AI উত্সাহী যিনি গভীর শিক্ষার মডেলগুলির প্রশিক্ষণ বুঝতে এবং অন্বেষণ করতে চান, আমাদের কর্মপ্রবাহ আপনার জন্য সুবিধাজনক পরিষেবা সরবরাহ করবে। এটি জটিল প্রাক-প্রক্রিয়াকরণ, মডেল প্রশিক্ষণ, এবং অপ্টিমাইজেশন পদক্ষেপগুলি সমাধান করে এবং আরও "বোঝার" চ্যাটজিপিটি বড়-স্কেল মডেল তৈরি করার জন্য শুধুমাত্র 1-2 ঘন্টার সহজ অপারেশন এবং 20 ঘন্টার চলমান সময়ের প্রয়োজন।

তো চলুন শুরু করা যাক এই জাদুকরী যাত্রা! আসুন AI এর ভবিষ্যত সবার সামনে নিয়ে আসি।

একটি চ্যাটজিপিটি তৈরি করার জন্য শুধুমাত্র তিনটি ধাপ যা আপনাকে আরও ভালভাবে "বুঝবে"

  1. একটি 3090 স্তরের সমতুল্য কম খরচে একটি GPU কার্ড ভাড়া নিন
  2. ডলফিন শিডিউলার শুরু করুন
  3. DolphinScheduler পৃষ্ঠায় প্রশিক্ষণ কর্মপ্রবাহ এবং স্থাপনার কর্মপ্রবাহে ক্লিক করুন এবং সরাসরি আপনার ChatGPT-এর অভিজ্ঞতা নিন

একটি 3090 গ্রাফিক্স কার্ড দিয়ে একটি হোস্ট প্রস্তুত করা হচ্ছে

প্রথমত, আপনার একটি 3090 গ্রাফিক্স কার্ড প্রয়োজন। আপনার যদি একটি ডেস্কটপ কম্পিউটার থাকে তবে আপনি এটি সরাসরি ব্যবহার করতে পারেন। যদি না হয়, অনলাইনে GPU সহ ভাড়ার জন্য অনেক হোস্ট রয়েছে। এখানে আমরা প্রয়োগ করার জন্য একটি উদাহরণ হিসাবে AutoDL ব্যবহার করি। https://www.autodl.com/home খুলুন, নিবন্ধন করুন এবং লগ ইন করুন। এর পরে, আপনি স্ক্রিনে দেখানো ধাপ 1, 2, এবং 3 অনুযায়ী কম্পিউটিং পাওয়ার মার্কেটে সংশ্লিষ্ট সার্ভারটি বেছে নিতে পারেন।

ছবি সূত্র: লেখকের নিজের ছবি


এখানে, RTX 3090 গ্রাফিক্স কার্ড বেছে নেওয়ার পরামর্শ দেওয়া হচ্ছে, যা উচ্চ খরচ-পারফরম্যান্স অনুপাত প্রদান করে। পরীক্ষার পরে, এটি পাওয়া গেছে যে এক থেকে দুই জন অনলাইন কাজের জন্য RTX 3090 ব্যবহার করতে পারে। আপনি যদি দ্রুত প্রশিক্ষণ এবং প্রতিক্রিয়া গতি চান তবে আপনি আরও শক্তিশালী গ্রাফিক্স কার্ড বেছে নিতে পারেন। একবার প্রশিক্ষণে প্রায় 20 ঘন্টা সময় লাগে, যখন পরীক্ষার জন্য প্রায় 2-3 ঘন্টা লাগে। 40 ইউয়ানের বাজেটের সাথে, আপনি সহজেই এটি সম্পন্ন করতে পারেন।

আয়না

কমিউনিটি মিররে ক্লিক করুন, এবং তারপরে নিচের লাল বাক্সে WhaleOps/dolphinscheduler-llm/dolphinscheduler-llm-0521 লিখুন। আপনি নীচের চিত্র হিসাবে নির্বাচন করতে পারেন. বর্তমানে, শুধুমাত্র V1 সংস্করণ উপলব্ধ। ভবিষ্যতে, নতুন সংস্করণ প্রকাশ করা হলে, আপনি সর্বশেষ একটি চয়ন করতে পারেন।

ছবি সূত্র: লেখকের নিজের ছবি


যদি আপনাকে একাধিকবার মডেলটি প্রশিক্ষণের প্রয়োজন হয়, তাহলে হার্ড ডিস্কের ক্ষমতা প্রায় 100GB পর্যন্ত প্রসারিত করার সুপারিশ করা হয়।


এটি তৈরি করার পরে, নিম্নলিখিত চিত্রটিতে প্রদর্শিত অগ্রগতি বারটি সম্পূর্ণ হওয়ার জন্য অপেক্ষা করুন।

ডলফিন শিডিউলার শুরু করুন

ইন্টারফেসে আপনার নিজস্ব ওপেন-সোর্স বৃহৎ-স্কেল মডেল স্থাপন এবং ডিবাগ করার জন্য, আপনাকে ডলফিনশিডুলার সফ্টওয়্যারটি শুরু করতে হবে এবং আমাদের নিম্নলিখিত কনফিগারেশনের কাজটি করতে হবে:

সার্ভার অ্যাক্সেস করতে

দুটি পদ্ধতি উপলব্ধ আছে। আপনি আপনার পছন্দ অনুসারে একটি চয়ন করতে পারেন:

  1. JupyterLab এর মাধ্যমে লগইন করুন (নন-কোডারদের জন্য):

নিচে দেখানো JupyterLab বোতামে ক্লিক করুন।

ছবি সূত্র: লেখকের নিজের ছবি


পৃষ্ঠাটি JupyterLab-এ পুনঃনির্দেশিত হবে; সেখান থেকে, আপনি প্রবেশ করতে "টার্মিনাল" ক্লিক করতে পারেন।

ছবি সূত্র: লেখকের নিজের ছবি


2. টার্মিনালের মাধ্যমে লগইন করুন (কোডারদের জন্য):

আমরা নিম্নলিখিত ছবিতে দেখানো বোতাম থেকে SSH সংযোগ কমান্ড পেতে পারি।

ছবি সূত্র: লেখকের নিজের ছবি


তারপর, টার্মিনালের মাধ্যমে সংযোগ স্থাপন করুন।

ছবি সূত্র: লেখকের নিজের ছবি


DolphinScheduler এর মেটাডেটা আমদানি করুন

DolphinScheduler-এ, ওয়ার্কফ্লো সংজ্ঞা, পরিবেশ কনফিগারেশন, ভাড়াটে তথ্য, ইত্যাদি সহ সমস্ত মেটাডেটা ডাটাবেসে সংরক্ষিত হয়৷ ডলফিনশিডুলার চালু হলে ব্যবহারকারীদের এই ওয়ার্কফ্লোগুলি দেখতে সুবিধাজনক করতে, আমরা এটিকে কপি করে সরাসরি পূর্ব-সংজ্ঞায়িত ওয়ার্কফ্লো মেটাডেটা আমদানি করতে পারি৷ পর্দা থেকে


MySQL এ ডেটা আমদানির জন্য স্ক্রিপ্ট পরিবর্তন করুন:

টার্মিনাল ব্যবহার করে, নিম্নলিখিত ডিরেক্টরিতে নেভিগেট করুন:

cd apache-dolphinscheduler-3.1.5-bin


import_ds_metadata.sh ফাইলটি খুলতে vim import_ds_metadata.sh কমান্ডটি চালান। ফাইলের বিষয়বস্তু নিম্নরূপ:



Set variables

Hostname

HOST="xxx.xxx.xxx.x"


UsernameUSERNAME="root"PasswordPASSWORD="xxxx"PortPORT=3306Database to import intoDATABASE="ds315_llm_test"SQL filenameSQL_FILE="ds315_llm.sql"mysql -h $HOST -P $PORT -u $USERNAME -p$PASSWORD -e "CREATE DATABASE $DATABASE;"mysql -h $HOST -P $PORT -u $USERNAME -p$PASSWORD $DATABASE < $SQL_FILE


আপনার সর্বজনীন নেটওয়ার্কে একটি MySQL ডাটাবেসের প্রাসঙ্গিক কনফিগারেশন মানগুলির সাথে xxx.xxx.xxx.x এবং xxxx প্রতিস্থাপন করুন (আপনি আলিবাবা ক্লাউড, টেনসেন্ট ক্লাউডে একটির জন্য আবেদন করতে পারেন, অথবা নিজে একটি ইনস্টল করতে পারেন)। তারপর চালান:

bash import_ds_metadata.sh


কার্যকর করার পরে, যদি আগ্রহী হন, আপনি ডাটাবেসের সংশ্লিষ্ট মেটাডেটা পরীক্ষা করতে পারেন (MySQL এর সাথে সংযোগ করুন এবং দেখুন, যদি আপনি কোডটির সাথে পরিচিত না হন তবে এই পদক্ষেপটি এড়িয়ে যান)।

ছবি সূত্র: লেখকের নিজের ছবি


ডলফিন শিডিউলার শুরু করুন

সার্ভার কমান্ড লাইনে, নিম্নলিখিত ফাইলটি খুলুন এবং পূর্বে আমদানি করা ডাটাবেসের সাথে DolphinScheduler সংযোগ করতে কনফিগারেশনটি পরিবর্তন করুন:


/root/apache-dolphinscheduler-3.1.5-bin/bin/env/dolphinscheduler_env.sh


ডেটাবেস বিভাগে প্রাসঙ্গিক কনফিগারেশন পরিবর্তন করুন এবং অন্যান্য বিভাগগুলি অপরিবর্তিত রাখুন। 'HOST' এবং 'PASSWORD'-এর মানগুলি আমদানি করা ডাটাবেসের কনফিগারেশন মানগুলিতে পরিবর্তন করুন, যেমন, xxx.xxx.xxx.x এবং xxxx:


export DATABASE=mysqlexport SPRING_PROFILES_ACTIVE=${DATABASE}export SPRING_DATASOURCE_URL="jdbc:mysql://HOST:3306/ds315_llm_test?useUnicode=true&characterEncoding=UTF-8&useSSL=false"export SPRING_DATASOURCE_USERNAME="root"export SPRING_DATASOURCE_PASSWORD="xxxxxx"......


কনফিগার করার পরে, চালান (এই ডিরেক্টরিতেও /root/apache-dolphinscheduler-3.1.5-bin):

bash ./bin/dolphinscheduler-daemon.sh start standalone-server


একবার কার্যকর করা হলে, আমরা tail -200f standalone-server/logs/dolphinscheduler-standalone.log ব্যবহার করে লগগুলি পরীক্ষা করতে পারি। এই সময়ে, DolphinScheduler আনুষ্ঠানিকভাবে চালু হয়!


পরিষেবাটি শুরু করার পরে, আমরা একটি URL এ পুনঃনির্দেশিত করার জন্য AutoDL কনসোলে (লাল রঙে হাইলাইট করা) "কাস্টম পরিষেবা" এ ক্লিক করতে পারি:

ছবি সূত্র: লেখকের নিজের ছবি


ইউআরএল খোলার পরে, যদি এটি একটি 404 ত্রুটি দেখায়, চিন্তা করবেন না। URL-এ শুধু প্রত্যয় /dolphinscheduler/ui যোগ করুন:

ছবি সূত্র: লেখকের নিজের ছবি

অটোডিএল মডিউলটি পোর্ট 6006 খোলে। ডলফিনশিডুলারের পোর্টটি 6006-এ কনফিগার করার পরে, আপনি প্রদত্ত এন্ট্রি পয়েন্টের মাধ্যমে এটি অ্যাক্সেস করতে পারেন। যাইহোক, URL পুনঃনির্দেশের কারণে, আপনি একটি 404 ত্রুটির সম্মুখীন হতে পারেন। এই ধরনের ক্ষেত্রে, আপনাকে ম্যানুয়ালি URLটি সম্পূর্ণ করতে হবে।



লগইন শংসাপত্র:

ব্যবহারকারীর নাম: admin

পাসওয়ার্ড: dolphinscheduler123


লগ ইন করার পর, "ভিকুনা" নামের পূর্বনির্ধারিত প্রকল্প দেখতে "প্রকল্প ব্যবস্থাপনা" এ ক্লিক করুন। প্রকল্পে প্রবেশ করতে "ভিকুনা" এ ক্লিক করুন।

ছবি সূত্র: লেখকের নিজের ছবি


ওপেন সোর্স বড় মডেল প্রশিক্ষণ এবং স্থাপনা

কর্মপ্রবাহের সংজ্ঞা

ভিকুনা প্রজেক্টে প্রবেশ করার পর, আপনি তিনটি ওয়ার্কফ্লো দেখতে পাবেন: ট্রেনিং, ডিপ্লয়, এবং কিল_সার্ভিস। আসুন তাদের ব্যবহার এবং কীভাবে বড় মডেলগুলি কনফিগার করতে হয় এবং আপনার ডেটা প্রশিক্ষণের অন্বেষণ করি।

ছবি সূত্র: লেখকের নিজের ছবি


সংশ্লিষ্ট ওয়ার্কফ্লো চালানোর জন্য আপনি নিচের রান বোতামে ক্লিক করতে পারেন।

ছবি সূত্র: লেখকের নিজের ছবি


প্রশিক্ষণ

প্রশিক্ষণ কর্মপ্রবাহে ক্লিক করে, আপনি দুটি সংজ্ঞা দেখতে পাবেন। একটি হল লোরা (প্রধানত আলপাকা-লোরা, https://github.com/tloen/alpaca-lora ব্যবহার করে) এর মাধ্যমে মডেলটিকে ফাইন-টিউন করার জন্য এবং অন্যটি হল চূড়ান্ত মডেল পেতে প্রশিক্ষিত মডেলটিকে বেস মডেলের সাথে একত্রিত করা .

ছবি সূত্র: লেখকের নিজের ছবি


ওয়ার্কফ্লোতে নিম্নলিখিত প্যারামিটার রয়েছে (রান ক্লিক করার পরে পপ আপ হয়):


  • base_model: বেস মডেল, যা আপনার প্রয়োজন অনুযায়ী চয়ন এবং ডাউনলোড করা যেতে পারে। ওপেন সোর্স বৃহৎ মডেলগুলি শুধুমাত্র শেখার এবং অভিজ্ঞতামূলক উদ্দেশ্যে। বর্তমান ডিফল্ট হল TheBloke/vicuna-7B-1.1-HF।
  • data_path: আপনার ব্যক্তিগতকৃত প্রশিক্ষণ ডেটা এবং ডোমেন-নির্দিষ্ট ডেটার পথ, ডিফল্ট /root/demo-data/llama_data.json।
  • lora_path: প্রশিক্ষিত লোরা ওজন সংরক্ষণের পথ, /root/autodl-tmp/vicuna-7b-lora-weight।
  • output_path: বেস মডেল এবং লোরা ওজন একত্রিত করার পরে চূড়ান্ত মডেলের সংরক্ষণের পথ, এটিকে নোট করুন কারণ এটি স্থাপনের জন্য প্রয়োজন হবে।
  • num_epochs: প্রশিক্ষণের পরামিতি, প্রশিক্ষণ যুগের সংখ্যা। এটি পরীক্ষার জন্য 1 এ সেট করা যেতে পারে, সাধারণত 3 ~ 10 এ সেট করা হয়।
  • cutoff_len: সর্বাধিক পাঠ্য দৈর্ঘ্য, ডিফল্ট 1024।
  • micro_batch_size: ব্যাচের আকার।

ছবি সূত্র: লেখকের নিজের ছবি


স্থাপন করুন

বড় মডেল স্থাপনের জন্য ওয়ার্কফ্লো (প্রধানত FastChat ব্যবহার করে, https://github.com/lm-sys/FastChat )। এটি প্রথমে নিয়োজিত মডেলটিকে হত্যা করতে kill_service আহ্বান করবে, তারপর ক্রমানুসারে কন্ট্রোলারটি শুরু করবে, মডেলটি যুক্ত করবে এবং তারপরে Gradio ওয়েব পরিষেবা খুলবে।

ছবি সূত্র: লেখকের নিজের ছবি


শুরুর পরামিতিগুলি নিম্নরূপ:

ছবি সূত্র: লেখকের নিজের ছবি


  • মডেল: মডেল পাথ, এটি একটি Huggingface মডেল আইডি বা আমাদের দ্বারা প্রশিক্ষিত মডেল পাথ হতে পারে, যেমন, উপরের প্রশিক্ষণ কর্মপ্রবাহের output_path। ডিফল্ট হল TheBloke/vicuna-7B-1.1-HF। ডিফল্ট ব্যবহার করা হলে, এটি সরাসরি ভিকুনা-7বি মডেল স্থাপন করবে।

কিল_সেবা

এই কর্মপ্রবাহটি স্থাপন করা মডেলকে হত্যা করতে এবং GPU মেমরি প্রকাশ করতে ব্যবহৃত হয়। এই কর্মপ্রবাহের কোন পরামিতি নেই এবং আপনি এটি সরাসরি চালাতে পারেন। আপনি যদি নিয়োজিত পরিষেবাটি বন্ধ করতে চান (যেমন যখন আপনাকে মডেলটি পুনরায় প্রশিক্ষণের প্রয়োজন হয় বা যখন অপর্যাপ্ত GPU মেমরি থাকে), আপনি স্থাপন করা পরিষেবাটিকে মেরে ফেলার জন্য সরাসরি kill_service ওয়ার্কফ্লো চালাতে পারেন।


কয়েকটি উদাহরণের মধ্য দিয়ে যাওয়ার পরে, আপনার স্থাপনা সম্পূর্ণ হবে। এখন ব্যবহারিক ক্রিয়াকলাপটি একবার দেখে নেওয়া যাক:

বড় মডেল অপারেশন উদাহরণ

  1. একটি বড় মডেল প্রশিক্ষণ

প্রশিক্ষণ কর্মপ্রবাহ কার্যকর করে এবং ডিফল্ট পরামিতি নির্বাচন করে সরাসরি কর্মপ্রবাহ শুরু করুন।

ছবি সূত্র: লেখকের নিজের ছবি


লগগুলি দেখতে সংশ্লিষ্ট টাস্কে ডান-ক্লিক করুন, নীচে দেখানো হয়েছে:

ছবি সূত্র: লেখকের নিজের ছবি


আপনি সাইডবারের নীচে বাম দিকে টাস্ক ইনস্ট্যান্স প্যানেলে টাস্ক স্ট্যাটাস এবং লগগুলি দেখতে পারেন। প্রশিক্ষণ প্রক্রিয়া চলাকালীন, আপনি বর্তমান প্রশিক্ষণের ধাপ, ক্ষতির পরিমাপ, অবশিষ্ট সময় ইত্যাদি সহ লগগুলি পরীক্ষা করে অগ্রগতি নিরীক্ষণ করতে পারেন। বর্তমান পদক্ষেপ নির্দেশ করে একটি অগ্রগতি বার রয়েছে, যেখানে ধাপ = (ডেটা আকার * যুগ) / ব্যাচ আকার

ছবি সূত্র: লেখকের নিজের ছবি


প্রশিক্ষণ শেষ হওয়ার পরে, লগগুলি নিম্নলিখিতগুলির মতো দেখাবে:

ছবি সূত্র: লেখকের নিজের ছবি


আপনার ব্যক্তিগতকৃত প্রশিক্ষণ ডেটা আপডেট করা হচ্ছে

আমাদের ডিফল্ট ডেটা /root/demo-data/llama_data.json এ রয়েছে। বর্তমান ডেটা উৎস হল Huatuo, একটি মেডিকেল মডেল যা চীনা মেডিকেল ডেটা ব্যবহার করে সূক্ষ্মভাবে তৈরি করা হয়েছে। হ্যাঁ, আমাদের উদাহরণ হল একজন পারিবারিক ডাক্তারকে প্রশিক্ষণ দেওয়া:

ছবি সূত্র: লেখকের নিজের ছবি


আপনার যদি একটি নির্দিষ্ট ক্ষেত্রে ডেটা থাকে তবে আপনি নিজের ডেটা নির্দেশ করতে পারেন, ডেটা বিন্যাসটি নিম্নরূপ:


প্রতি লাইনে একটি JSON, এবং ক্ষেত্রের অর্থ হল:

  • নির্দেশ ****: মডেল দিতে নির্দেশ.
  • input: ইনপুট।
  • আউটপুট: প্রত্যাশিত মডেল আউটপুট।

উদাহরণ স্বরূপ:

{"instruction": "calculation", "input": "1+1 equals?", "output": "2"}


অনুগ্রহ করে মনে রাখবেন যে আপনি নির্দেশাবলী এবং ইনপুট ক্ষেত্রগুলিকে একক নির্দেশের ক্ষেত্রে একত্রিত করতে পারেন৷ ইনপুট ক্ষেত্রটিও খালি রাখা যেতে পারে।


প্রশিক্ষণের সময়, আপনার নিজস্ব ডেটা চালানোর জন্য data_path প্যারামিটার পরিবর্তন করুন।


বিঃদ্রঃ:


প্রথম প্রশিক্ষণ সম্পাদনের সময়, বেস মডেলটি নির্দিষ্ট স্থান থেকে আনা হবে, যেমন TheBloke/vicuna-7B-1.1-HF। একটি ডাউনলোড প্রক্রিয়া হবে, তাই ডাউনলোড সম্পূর্ণ হওয়ার জন্য অপেক্ষা করুন। এই মডেলের পছন্দ ব্যবহারকারী দ্বারা নির্ধারিত হয়, এবং আপনি অন্যান্য ওপেন-সোর্স বড় মডেলগুলি ডাউনলোড করতেও বেছে নিতে পারেন (সেগুলি ব্যবহার করার সময় অনুগ্রহ করে প্রাসঙ্গিক লাইসেন্সগুলি অনুসরণ করুন)৷


নেটওয়ার্ক সমস্যার কারণে, বেস মডেল ডাউনলোড প্রথম প্রশিক্ষণ সম্পাদনের অর্ধেক পথ ব্যর্থ হতে পারে। এই ধরনের ক্ষেত্রে, আপনি ব্যর্থ টাস্কে ক্লিক করতে পারেন এবং প্রশিক্ষণ চালিয়ে যেতে এটি পুনরায় চালানো বেছে নিতে পারেন। অপারেশনটি নীচে দেখানো হয়েছে:

ছবি সূত্র: লেখকের নিজের ছবি


প্রশিক্ষণ বন্ধ করতে, আপনি স্টপ বোতামটি ক্লিক করতে পারেন, যা প্রশিক্ষণের জন্য ব্যবহৃত GPU মেমরি প্রকাশ করবে।

স্থাপনার কর্মপ্রবাহ

ওয়ার্কফ্লো সংজ্ঞা পৃষ্ঠায়, এটি চালানোর জন্য এবং মডেল স্থাপন করতে কর্মপ্রবাহ স্থাপনে ক্লিক করুন।

ছবি সূত্র: লেখকের নিজের ছবি


আপনি যদি নিজের মডেলকে প্রশিক্ষিত না করে থাকেন, তাহলে আপনি ডিফল্ট পরামিতি TheBloke/vicuna-7B-1.1-HF দিয়ে vicuna-7b মডেল স্থাপন করতে কর্মপ্রবাহ চালাতে পারেন, যেমনটি নীচের ছবিতে দেখানো হয়েছে:

ছবি সূত্র: লেখকের নিজের ছবি


আপনি যদি পূর্ববর্তী ধাপে একটি মডেল প্রশিক্ষণ দিয়ে থাকেন, তাহলে আপনি এখন আপনার মডেল স্থাপন করতে পারেন। স্থাপনার পরে, আপনি আপনার নিজের বড় মডেলের অভিজ্ঞতা নিতে পারেন। স্টার্টআপ প্যারামিটারগুলি নিম্নরূপ, যেখানে আপনাকে পূর্ববর্তী ধাপ থেকে মডেলটির output_path পূরণ করতে হবে:

ছবি সূত্র: লেখকের নিজের ছবি


এর পরে, এর স্থাপন করা ওয়ার্কফ্লো উদাহরণটি প্রবেশ করা যাক। ওয়ার্কফ্লো ইনস্ট্যান্সে ক্লিক করুন এবং তারপর "ডিপ্লয়" উপসর্গ সহ ওয়ার্কফ্লো ইনস্ট্যান্সে ক্লিক করুন।

ছবি সূত্র: লেখকের নিজের ছবি

রাইট-ক্লিক করুন এবং "refresh_gradio_web_service" নির্বাচন করুন টাস্ক লগগুলি দেখতে এবং আমাদের বড় মডেল লিঙ্কের অবস্থান খুঁজে বের করুন৷


অপারেশনটি নীচে দেখানো হয়েছে:

ছবি সূত্র: লেখকের নিজের ছবি



লগগুলিতে, আপনি একটি লিঙ্ক পাবেন যা সর্বজনীনভাবে অ্যাক্সেস করা যেতে পারে, যেমন:

ছবি সূত্র: লেখকের নিজের ছবি


এখানে দুটি লিঙ্ক আছে. লিঙ্ক 0.0.0.0:7860 অ্যাক্সেস করা যাবে না কারণ AutoDL শুধুমাত্র পোর্ট 6006 খোলে, যা ইতিমধ্যেই ডলফিনশেডিউলারের জন্য ব্যবহৃত হয়। আপনি সরাসরি এটির নীচের লিঙ্কটি অ্যাক্সেস করতে পারেন, যেমন [https://81c9f6ce11eb3c37a4.gradio.live.](https://81c9f6ce11eb3c37a4.gradio.live.)


অনুগ্রহ করে মনে রাখবেন যে এই লিঙ্কটি প্রতিবার আপনি স্থাপন করার সময় পরিবর্তিত হতে পারে, তাই আপনাকে লগ থেকে এটি আবার খুঁজে বের করতে হবে।


একবার আপনি লিঙ্কে প্রবেশ করলে, আপনি আপনার নিজস্ব ChatGPT-এর কথোপকথন পৃষ্ঠা দেখতে পাবেন!

ছবি সূত্র: লেখকের নিজের ছবি


ছবি সূত্র: লেখকের নিজের ছবি


হ্যাঁ! এখন আপনার নিজস্ব চ্যাটজিপিটি আছে, এবং এর ডেটা শুধুমাত্র আপনাকেই পরিবেশন করে!


এবং আপনি শুধুমাত্র এক কাপ কফির চেয়ে কম খরচ করেছেন~~


এগিয়ে যান এবং আপনার নিজের ব্যক্তিগত ChatGPT-এর অভিজ্ঞতা নিন!

সারসংক্ষেপ

এই ডেটা-চালিত এবং প্রযুক্তি-ভিত্তিক বিশ্বে, একটি ডেডিকেটেড ChatGPT মডেলের অপরিমেয় মূল্য রয়েছে। কৃত্রিম বুদ্ধিমত্তা এবং গভীর শিক্ষার অগ্রগতির সাথে, আমরা এমন এক যুগে রয়েছি যেখানে ব্যক্তিগতকৃত AI সহকারীকে আকৃতি দেওয়া যেতে পারে। আপনার নিজস্ব ChatGPT মডেলকে প্রশিক্ষণ দেওয়া এবং স্থাপন করা আমাদের এআই এবং কীভাবে এটি আমাদের বিশ্বকে পরিবর্তন করছে তা আরও ভালভাবে বুঝতে সাহায্য করতে পারে।


সংক্ষেপে, নিজের হাতে একটি ChatGPT মডেল প্রশিক্ষণ এবং স্থাপন করা আপনাকে ডেটা সুরক্ষা এবং গোপনীয়তা রক্ষা করতে, নির্দিষ্ট ব্যবসায়িক প্রয়োজনীয়তা পূরণ করতে, প্রযুক্তি খরচ বাঁচাতে এবং ডলফিনশিডুলারের মতো ওয়ার্কফ্লো টুল ব্যবহার করে প্রশিক্ষণ প্রক্রিয়া স্বয়ংক্রিয় করতে সহায়তা করতে পারে। এটি আপনাকে স্থানীয় আইন ও প্রবিধান মেনে চলতেও অনুমতি দেয়। অতএব, আপনার নিজেরাই একটি ChatGPT মডেল প্রশিক্ষণ এবং স্থাপন করা বিবেচনা করার জন্য একটি উপযুক্ত বিকল্প।


গুরুত্বপূর্ণ নোট:

  • ডেটা সুরক্ষা এবং গোপনীয়তা: পাবলিক API পরিষেবাগুলির মাধ্যমে ChatGPT ব্যবহার করার সময়, আপনার ডেটা সুরক্ষা এবং গোপনীয়তা সম্পর্কে উদ্বেগ থাকতে পারে। এটি একটি বৈধ উদ্বেগ কারণ আপনার ডেটা নেটওয়ার্কের মাধ্যমে প্রেরণ করা হতে পারে৷ আপনার নিজের উপর মডেলটি প্রশিক্ষণ এবং স্থাপন করে, আপনি নিশ্চিত করতে পারেন যে আপনার ডেটা শুধুমাত্র আপনার নিজের ডিভাইসে বা ভাড়া করা সার্ভারে সংরক্ষণ এবং প্রক্রিয়া করা হয়েছে, ডেটা সুরক্ষা এবং গোপনীয়তা নিশ্চিত করে৷
  • ডোমেন-নির্দিষ্ট জ্ঞান: নির্দিষ্ট ব্যবসার প্রয়োজনীয়তা রয়েছে এমন সংস্থা বা ব্যক্তিদের জন্য, আপনার নিজস্ব ChatGPT মডেলের প্রশিক্ষণ নিশ্চিত করে যে মডেলটিতে আপনার ব্যবসার সাথে সম্পর্কিত সর্বশেষ এবং সবচেয়ে প্রাসঙ্গিক জ্ঞান রয়েছে। আপনার ব্যবসার ডোমেন নির্বিশেষে, আপনার ব্যবসার প্রয়োজনের জন্য বিশেষভাবে প্রশিক্ষিত একটি মডেল একটি জেনেরিক মডেলের চেয়ে বেশি মূল্যবান হবে৷
  • বিনিয়োগ খরচ: OpenAI-এর ChatGPT মডেল ব্যবহার করার জন্য নির্দিষ্ট কিছু খরচ হতে পারে। একইভাবে, আপনি যদি নিজে থেকে মডেলটিকে প্রশিক্ষণ ও স্থাপন করতে চান, তাহলে আপনাকে সম্পদ বিনিয়োগ করতে হবে এবং প্রযুক্তির খরচ বহন করতে হবে। উদাহরণস্বরূপ, আপনি 40 ইউয়ানের কম দামে বড় মডেলগুলি ডিবাগ করার অভিজ্ঞতা পেতে পারেন, তবে আপনি যদি এটি দীর্ঘমেয়াদী চালানোর পরিকল্পনা করেন তবে একটি Nvidia RTX 3090 গ্রাফিক্স কার্ড কেনা বা ক্লাউড সার্ভার ভাড়া নেওয়ার পরামর্শ দেওয়া হচ্ছে৷ অতএব, আপনাকে ভালো-মন্দ বিবেচনা করতে হবে এবং আপনার নির্দিষ্ট পরিস্থিতিতে সবচেয়ে উপযুক্ত সমাধান বেছে নিতে হবে।
  • DolphinScheduler: Apache DolphinScheduler-এর কর্মপ্রবাহ ব্যবহার করে, আপনি সম্পূর্ণ প্রশিক্ষণ প্রক্রিয়া স্বয়ংক্রিয় করতে পারেন, প্রযুক্তিগত বাধাকে অনেকাংশে কমিয়ে আনতে পারেন। আপনার কাছে অ্যালগরিদম সম্পর্কে বিস্তৃত জ্ঞান না থাকলেও, আপনি এই ধরনের সরঞ্জামগুলির সাহায্যে আপনার নিজের মডেলকে সফলভাবে প্রশিক্ষণ দিতে পারেন। বৃহৎ মডেল প্রশিক্ষণকে সমর্থন করার পাশাপাশি, DolphinScheduler বিগ ডেটা শিডিউলিং এবং মেশিন লার্নিং শিডিউলিংকেও সমর্থন করে, আপনাকে এবং আপনার নন-টেকনিক্যাল কর্মীদের সহজেই বড় ডেটা প্রসেসিং, ডেটা প্রস্তুতি, মডেল প্রশিক্ষণ এবং মডেল স্থাপনে সহায়তা করে। অধিকন্তু, এটি ওপেন সোর্স এবং বিনামূল্যে ব্যবহার করা যায়।
  • ওপেন সোর্স লার্জ মডেলের আইনি এবং নিয়ন্ত্রক সীমাবদ্ধতা: DolphinScheduler শুধুমাত্র একটি ভিজ্যুয়াল AI ওয়ার্কফ্লো টুল এবং কোন ওপেন সোর্স বড় মডেল প্রদান করে না। ওপেন সোর্স বড় মডেলগুলি ব্যবহার এবং ডাউনলোড করার সময়, আপনাকে অবশ্যই প্রতিটি মডেলের সাথে যুক্ত বিভিন্ন ব্যবহারের সীমাবদ্ধতা সম্পর্কে সচেতন হতে হবে এবং সংশ্লিষ্ট ওপেন-সোর্স লাইসেন্সগুলি মেনে চলতে হবে৷ এই নিবন্ধে দেওয়া উদাহরণ শুধুমাত্র ব্যক্তিগত শিক্ষা এবং অভিজ্ঞতার উদ্দেশ্যে। বড় মডেলগুলি ব্যবহার করার সময়, ওপেন-সোর্স মডেল লাইসেন্সিংয়ের সাথে সম্মতি নিশ্চিত করা গুরুত্বপূর্ণ। উপরন্তু, বিভিন্ন দেশে ডেটা স্টোরেজ এবং প্রক্রিয়াকরণ সংক্রান্ত বিভিন্ন কঠোর নিয়ম রয়েছে। বড় মডেলগুলি ব্যবহার করার সময়, আপনার অবস্থানের নির্দিষ্ট আইনি প্রবিধান এবং নীতিগুলি মেনে চলার জন্য আপনাকে অবশ্যই মডেলটি কাস্টমাইজ এবং সামঞ্জস্য করতে হবে৷ এতে স্থানীয় গোপনীয়তা এবং সংবেদনশীল তথ্য পরিচালনার নিয়ম মেনে মডেল আউটপুটগুলির নির্দিষ্ট ফিল্টারিং অন্তর্ভুক্ত থাকতে পারে।


এছাড়াও এখানে প্রকাশিত.