Gptrim- এর সাথে পরিচয় করিয়ে দেওয়া হচ্ছে, একটি বিনামূল্যের ওয়েব অ্যাপ যা আপনার প্রম্পটের আকার 40%-60% কমিয়ে দেবে এবং GPT প্রক্রিয়া করার জন্য বেশিরভাগ আসল তথ্য সংরক্ষণ করবে। gptrim এছাড়াও একটি পাইথন লাইব্রেরি ।
gptrim এ আপনার GPT প্রম্পট পেস্ট করুন। ট্রিম করা টেক্সট কপি করে GPT-এ দিন।
ছাঁটা টেক্সট অবাস্তব মত দেখাচ্ছে. কিন্তু জিপিটি তা বোঝে! 😁
এখানে প্রম্পট যা আপনি কম্প্রেশন গুণমান পরীক্ষা করতে ব্যবহার করতে পারেন:
This is an instance of compressed text. Rewrite it so that it has perfect grammar and is understandable by a human. Try to interpret it as faithfully as possible. Do not paraphrase or add anything to the text.
আপনি যদি GPT এর সাথে খেলা করে থাকেন, আপনি জানেন যে আপনি যা অর্জন করতে পারেন তার সবচেয়ে বড় সীমা প্রসঙ্গ উইন্ডো থেকে আসে, অর্থাৎ GPT এক সময়ে দেখতে পারে এমন মোট টোকেনের সংখ্যা।
এই নিবন্ধের সময় জিনিসগুলি কোথায় দাঁড়িয়েছে তা এখানে ( OpenAI ওভারভিউ ):
প্রসঙ্গ উইন্ডোর আকার টোকেনে পরিমাপ করা হয়। 1000 টোকেন প্রায় 750 শব্দের সাথে মিলে যায়।
GPT-3.5 API-এ 4k টোকেন বা প্রায় 6টি শব্দ পৃষ্ঠার একটি প্রসঙ্গ উইন্ডো রয়েছে।
আপনি কত টাকা দিতে ইচ্ছুক তার উপর নির্ভর করে GPT-4 API-এর মাধ্যমে আপনি 8k বা 32k আকারের একটি প্রসঙ্গ উইন্ডো পেতে পারেন।
এমনকি যদি আপনি অর্থ প্রদান করতে ইচ্ছুক হন, GPT-4 API সীমিত বিটাতে রয়েছে এবং বেশিরভাগ লোকেরা, আমি অন্তর্ভুক্ত, এটি অ্যাক্সেস করতে পারে না। ওপেনএআই, এখনও সেই আমন্ত্রণের অপেক্ষায়।
আপনি যখন APIs ব্যবহার করছেন, তখন প্রতিটি টোকেনের জন্য আপনার খরচ হয়।
আপনি একটি মাসিক ফি দিয়ে ChatGPT- এ ইন্টারেক্টিভভাবে GPT-4 ব্যবহার করতে পারেন। দুর্ভাগ্যবশত, চ্যাট বার্তাগুলি শুধুমাত্র অল্প সংখ্যক অক্ষরের জন্য উপযুক্ত হতে পারে। ChatGPT এবং আমি উভয়েই মাঝে মাঝে সেই সীমা অতিক্রম করি এবং আমাদের বার্তাগুলি বাধাগ্রস্ত হয়।
অনুশীলনে, এটি প্রচুর পরিমাণে পাঠ্যের উপর কাজ করে এমন অ্যাপ্লিকেশন তৈরি করা খুব কঠিন করে তোলে।
আপনার প্রম্পটে টোকেনগুলি হ্রাস করার অর্থ হল:
সাধারণভাবে, একটি প্রসঙ্গ উইন্ডো খুব বেশি হয় না। এমনকি যদি আপনি 32k এর জন্য অর্থ প্রদান করতে ইচ্ছুক হন, আপনি এখনও আরও বেশি চাইবেন।
জিপিটি মানুষের ভাষা ভবিষ্যদ্বাণীতে প্রশিক্ষিত। প্রতিদিনের ভিত্তিতে, যেকোনো মানুষের চেয়ে মানুষের ভাষা ভবিষ্যদ্বাণী করা অনেক ভালো। আপনি যদি এটিকে এমন একটি পাঠ্য দেন যা অত্যন্ত ঘনীভূত এবং সংকুচিত হয়, তবে এটি এখনও এটি পড়তে সক্ষম হবে।
স্পেস ব্যবহার বিবেচনা করুন. মানুষের শব্দের মধ্যে ফাঁকা প্রয়োজন কারণ আমাদের পাঠ্য দেখতে হবে। কিন্তু আমি স্পেস ছাড়াই লিখেছিলাম আপনি সম্ভবত এখনও আমাকে বুঝতে পারবেন।
আমার অনুমান হল যে একটি পাঠ্যের 95% স্পেস শুধুমাত্র চোখের পড়া সহজ করার জন্য আছে। GPT কেয়ার করে না। প্রতিটি স্থান যা আপনি বাদ দেন তা হল একটি অতিরিক্ত টোকেন যা আপনি তথ্য জানাতে ব্যবহার করতে পারেন।
আমরা কি শুধু স্পেস অপসারণের চেয়ে ভালো করতে পারি? অবশ্যই, আমি জিপিটি জিজ্ঞাসা করেছি। (আমি হতাশ হয়ে পড়েছিলাম কারণ আমি এটিকে বড় বড় ব্লগ পোস্টগুলি খাওয়ানোর চেষ্টা করছিলাম এবং সীমার বিপরীতে চলতে থাকলাম।) এটি একটি পাইথন ফাংশন নিয়ে এসেছিল যা নিম্নলিখিতগুলি করে:
পাঠ্যকে টোকেনাইজ করে
স্টপওয়ার্ডগুলি সরিয়ে দেয়
পোর্টার স্টেমিং অ্যালগরিদম প্রয়োগ করে
কয়েকটি সাধারণ শব্দ সরিয়ে দেয়: 'the', 'a', 'an', 'in', 'on', 'at', 'for', 'to', 'of'
সমস্ত স্পেস মুছে দেয় এবং শব্দগুলিকে একত্রিত করে
আপনি এখানে কোড পড়তে পারেন. এটা খুবই সাধারণ! এটি স্ট্যান্ডার্ড এনএলপি প্রিপ্রসেসিং স্টাফ। কিন্তু আমি এখনও কাউকে এই উদ্দেশ্যে এটি ব্যবহার করতে দেখিনি।
কয়েক সপ্তাহ আগে Twitter "Shoggoth Tongue" আবিষ্কার করেছে । আপনি একটি মূর্তিমান ভাষায় অত্যন্ত সংকুচিত পাঠ্য লেখার জন্য GPT পেতে পারেন যা এর নিজস্ব উদাহরণ বুঝতে পারে। এটি অত্যন্ত আকর্ষণীয়। যাইহোক, এটি অর্থ সাশ্রয়ের একটি পদ্ধতি হিসাবে কার্যকর নয় GPT, কারণ আপনাকে এখনও কম্প্রেশনের জন্য GPT ব্যবহার করতে হবে।
টেক্সট সংকুচিত করার জন্য gptrim-এর GPT-এর প্রয়োজন নেই, যা এটিকে দ্রুত এবং বিনামূল্যে করে।
gptrim আপনার প্রম্পটগুলিকে পুনরায় লিখবে যাতে সেগুলি ~50% ছোট হয়। আপনি সহজভাবে ChatGPT-এ সংক্ষিপ্ত প্রম্পট পেস্ট করতে পারেন বা এটি আপনার API-এ ফিড করতে পারেন। GPT তারপর আপনার নির্দেশাবলী অনুসরণ করবে। কোনো বিশেষ ব্যাখ্যার প্রয়োজন নেই। জিপিটি আপনার পাঠ্য সম্পর্কে অদ্ভুত কিছু দেখতে পাবে না!
আমি এটি ব্যাপকভাবে পরীক্ষা করিনি। আমি যা দেখেছি তা থেকে, GPT বেশিরভাগ মূল অর্থ পুনরুদ্ধার করতে পারে। এটি GPT-3.5 এর জন্যও সত্য।
কম্প্রেশন গুণমান যাচাই করার সর্বোত্তম উপায় হল পাঠ্যটি ডিকম্প্রেস করতে GPT কে বলা। আমি নিবন্ধের শীর্ষে এটির জন্য একটি প্রম্পট ভাগ করেছি।
কম্প্রেশন নিখুঁত নয়। কিছু বাক্যের জন্য, অর্থ হারিয়ে যায় বা ভুল ব্যাখ্যা করা হয়। আমি এমন অ্যাপ্লিকেশনগুলির জন্য এটি ব্যবহার করার পরামর্শ দিই না যেখানে সূক্ষ্মতা অত্যন্ত গুরুত্বপূর্ণ (যেমন চিকিৎসা নির্ণয়)।
এই প্রকল্পটি এক সন্ধ্যায় একসাথে হ্যাক করা হয়েছিল। এটা অনেক বেশি একটি সহযোগিতামূলক প্রচেষ্টা ছিল. আমি ধারণা নিয়ে এসেছি, এবং GPT ট্রিমিং ফাংশন লিখেছে। এটি ফ্লাস্ক ওয়েব অ্যাপ লেখার জন্য ভারী উত্তোলনও করেছে।
যোগ করা যেতে পারে যে বিভিন্ন উন্নতি আছে:
এটি প্রোগ্রাম্যাটিকভাবে করতে একটি পাইথন লাইব্রেরি প্রকাশ করুন।
GPT টোকেনে সঞ্চয় পরিমাপ করুন, অক্ষর সংখ্যা নয়।
OpenAI এর মূল্যের উপর ভিত্তি করে ডলার সঞ্চয় গণনা করুন।
আরো পরীক্ষা চালান. আমরা কি ট্রিমড ল্যাঙ্গুয়েজে উত্তর দিতে, ট্রিমড ল্যাঙ্গুয়েজে নিজেকে ভাবতে এবং শুধুমাত্র চূড়ান্ত ধাপ হিসেবে টেক্সট ডিকম্প্রেস করার জন্য জিপিটি পেতে পারি?
অবশেষে, জিপিটি ব্যবহার না করেই জিপিটির জন্য পাঠ্য সংকুচিত করার আরও ভাল পদ্ধতি থাকতে হবে। আমি এই স্পেসে নতুন ধারণার জন্য উন্মুখ।
আমি AI এর সাথে জিনিস তৈরি করতে এবং এটি সম্পর্কে লিখতে পছন্দ করি। লিঙ্কডইন এবং টুইটারে আমাকে খুঁজুন।