কখনও কখনও, এআই-জেনারেটেড ফটোগুলি কিছুটা বেরিয়ে আসে... অস্বস্তিকর। হতে পারে সেগুলি নিম্নমানের, বা সম্ভবত এমন অদ্ভুত শিল্পকর্ম রয়েছে যা চিত্রটিকে নিখুঁত থেকে কম দেখায়৷ কিন্তু ভয় নেই! কোডফর্মার দিনটি বাঁচাতে এখানে রয়েছে, আপনাকে সেই ছবিগুলিকে অল্প সময়ের মধ্যে ঠিক করতে সহায়তা করে৷ এই নির্দেশিকায়, আমি আপনাকে CodeFormer মডেলের সাথে পরিচয় করিয়ে দেব, এটি কীভাবে কাজ করে তা দেখাব এবং একটি সামান্য বিকৃত এআই-জেনারেটেড ফটো ঠিক করতে কীভাবে এটি ব্যবহার করবেন তা ব্যাখ্যা করব। নীচে দেখানো অন্য এআই মডেল থেকে আমি যে অদ্ভুত ইমেজটি পেয়েছি তা পরিষ্কার করার জন্য আমি সঠিক পদক্ষেপগুলি নিয়ে আপনাকে হাঁটব:
এই ছবিটি থেকে এসেছে
এই গাইডে, আমি আপনাকে দেখাব কিভাবে আমরা ব্যবহার করতে পারি
CodeFormer রেপ্লিকেট কোডেক্সে 6 তম স্থানে রয়েছে৷ 8M এর বেশি রান সহ এটি অত্যন্ত জনপ্রিয়। সুতরাং, এটা বলা নিরাপদ যে সম্প্রদায়টি সত্যিই এই টুলটি পছন্দ করে - এবং এর মানে আপনিও এটি ব্যবহার করতে পছন্দ করতে পারেন!
CodeFormer, দ্বারা নির্মিত
CodeFormer-এর অন্তর্নিহিত প্রযুক্তিটি একটি ট্রান্সফরমার-ভিত্তিক ভবিষ্যদ্বাণী নেটওয়ার্কের উপর ভিত্তি করে, যা কোড পূর্বাভাসের জন্য বিশ্বব্যাপী রচনা এবং প্রসঙ্গ মডেল করে। এটি মডেলটিকে প্রাকৃতিক মুখগুলি আবিষ্কার করতে দেয় যা লক্ষ্য মুখগুলির কাছাকাছি আনুমানিক, এমনকি ইনপুটগুলি গুরুতরভাবে অবনমিত হলেও৷ একটি নিয়ন্ত্রণযোগ্য বৈশিষ্ট্য রূপান্তর মডিউলও অন্তর্ভুক্ত করা হয়েছে, যা বিশ্বস্ততা এবং গুণমানের মধ্যে একটি নমনীয় ট্রেড-অফ সক্ষম করে। আপনি CodeFormer কিভাবে কাজ করে সে সম্পর্কে আরও পড়তে পারেন
আমরা এই প্রকল্পে কাজ শুরু করার আগে, মডেলটি আশা করা ইনপুট এবং আউটপুটগুলি বুঝতে এক সেকেন্ড সময় নেয়।
image
(ফাইল): ইনপুট ইমেজ আপনি ঠিক করতে চান।codeformer_fidelity
(সংখ্যা): গুণমান (নিম্ন সংখ্যা) এবং বিশ্বস্ততা (উচ্চ সংখ্যা) এর মধ্যে একটি ভারসাম্য। ডিফল্ট মান: 0.5।background_enhance
(বুলিয়ান): Real-ESRGAN দিয়ে ব্যাকগ্রাউন্ড ইমেজ উন্নত করতে হবে কিনা। ডিফল্ট মান: মিথ্যা।face_upsample
(বুলিয়ান): উচ্চ-রেজোলিউশন AI-তৈরি ইমেজগুলির জন্য পুনরুদ্ধার করা মুখগুলিকে আপস্যাম্পল করতে হবে কিনা৷ ডিফল্ট মান: মিথ্যা।upscale
(পূর্ণসংখ্যা): ছবির চূড়ান্ত আপস্যাম্পলিং স্কেল। ডিফল্ট মান: 2।মডেলের আউটপুট হল একটি URI স্ট্রিং যা স্থির চিত্রের প্রতিনিধিত্ব করে। এটি একটি JSON অবজেক্ট এবং নীচের বিন্যাসের মতো দেখাচ্ছে:
{ "type": "string", "title": "Output", "format": "uri" }
এখন যেহেতু আমরা ইনপুট এবং আউটপুটগুলি বুঝতে পেরেছি, আসুন একটি বিকৃত এআই-জেনারেটেড ফটো ঠিক করতে CodeFormer ব্যবহারে ডুব দেওয়া যাক।
আপনি যদি কোডিংয়ের জন্য প্রস্তুত না হন তবে আপনি কোডফর্মারের "ডেমো" এর সাথে তাদের UI এর মাধ্যমে প্রতিলিপিতে সরাসরি ইন্টারঅ্যাক্ট করতে পারেন। আপনি পারেন
আপনি যদি আরও প্রযুক্তিগত হন এবং শেষ পর্যন্ত CodeFormer-এর উপরে একটি দুর্দান্ত সরঞ্জাম তৈরি করতে চান, তাহলে আপনি প্রতিলিপিতে মডেলটি ব্যবহার করে আপনার চিত্রগুলি পুনরুদ্ধার এবং উন্নত করতে এই সহজ পদক্ষেপগুলি অনুসরণ করতে পারেন।
নিশ্চিত করুন যে আপনার কাছে একটি প্রতিলিপি অ্যাকাউন্ট এবং আপনার API কী সহজে আছে!
এটি করা বেশ সহজ:
pip install replicate
আপনি আপনার অ্যাকাউন্ট ট্যাবে প্রতিলিপি থেকে এটি পেতে পারেন।
export REPLICATE_API_TOKEN=[token]
রেপ্লিকেট পাইথন SDK-এর সাথে এটি করার জন্য আপনাকে শুধু কোডের কয়েকটি লাইনের প্রয়োজন।
import replicate output = replicate.run( "sczhou/codeformer:7de2ea26c616d5bf2245ad0d5e24f0ff9a6204578a5c876db53142edd9d2cd56", input={"image": open("path/to/file", "rb")} ) print(output)
এই ধাপে, আমরা replicate
লাইব্রেরি আমদানি করি এবং প্রদত্ত ইনপুট চিত্র সহ CodeFormer মডেল চালানোর জন্য run
ফাংশনটি কল করি। আউটপুটটি একটি URI স্ট্রিং হিসাবে মুদ্রিত হবে যা স্থির চিত্রের প্রতিনিধিত্ব করে।
এই প্রক্রিয়া থেকে আমি যে আউটপুট ইমেজটি পেয়েছি তা এখানে দেখানো হয়েছে, আমি যে জঘন্য ইনপুট দিয়ে শুরু করেছি তার বিপরীতে দেখানো হয়েছে। কি উন্নতি!
প্রতিলিপি কোডেক্স হল AI মডেলগুলি আবিষ্কার করার জন্য একটি দুর্দান্ত সংস্থান যা বিভিন্ন সৃজনশীল চাহিদা পূরণ করে, যার মধ্যে ইমেজ জেনারেশন, ইমেজ থেকে ইমেজ কনভার্সন এবং আরও অনেক কিছু। এটি একটি সম্পূর্ণরূপে অনুসন্ধানযোগ্য, ফিল্টারযোগ্য, প্রতিলিপিতে থাকা সমস্ত মডেলের ট্যাগ করা ডেটাবেস এবং এটি আপনাকে মডেলগুলির তুলনা করতে এবং মূল্য অনুসারে বাছাই করতে বা নির্মাতার দ্বারা অন্বেষণ করতে দেয়৷ এটি বিনামূল্যে, এবং এটিতে একটি ডাইজেস্ট ইমেলও রয়েছে যা নতুন মডেলগুলি বের হলে আপনাকে সতর্ক করবে যাতে আপনি সেগুলি চেষ্টা করতে পারেন৷
আপনি যদি CodeFormer এর অনুরূপ মডেল খুঁজে পেতে আগ্রহী হন...
মাথা ওভার
নির্দিষ্ট কীওয়ার্ড সহ মডেলগুলি অনুসন্ধান করতে পৃষ্ঠার শীর্ষে অনুসন্ধান বারটি ব্যবহার করুন, যেমন "চিত্র পুনরুদ্ধার," "ফেস বর্ধিতকরণ," বা "সুপার-রেজোলিউশন।" এটি আপনাকে আপনার অনুসন্ধান ক্যোয়ারী সম্পর্কিত মডেলগুলির একটি তালিকা দেখাবে৷
অনুসন্ধান ফলাফল পৃষ্ঠার ডানদিকে, আপনি বেশ কয়েকটি ফিল্টার পাবেন যা আপনাকে মডেলের তালিকাকে সংকুচিত করতে সাহায্য করতে পারে। আপনি টাইপ (চিত্র থেকে চিত্র, পাঠ্য থেকে চিত্র, ইত্যাদি), খরচ, জনপ্রিয়তা বা এমনকি নির্দিষ্ট নির্মাতাদের দ্বারা মডেলগুলি ফিল্টার এবং বাছাই করতে পারেন৷
এই ফিল্টারগুলি প্রয়োগ করে, আপনি এমন মডেলগুলি খুঁজে পেতে পারেন যা আপনার নির্দিষ্ট চাহিদা এবং পছন্দগুলির সাথে সবচেয়ে উপযুক্ত। উদাহরণস্বরূপ, আপনি যদি একটি চিত্র পুনরুদ্ধার মডেল খুঁজছেন যা সর্বাধিক জনপ্রিয়, আপনি কেবল অনুসন্ধান করতে পারেন এবং তারপর রানের সংখ্যা অনুসারে বাছাই করতে পারেন। সেই ক্ষেত্রে, আপনি GFPGAN মডেলটি পাবেন, যা আমি পুরানো ফটোগুলি পুনরুদ্ধার করতেও ব্যবহার করেছি - দেখুন
এই নির্দেশিকাটিতে, আমরা কোডফর্মার মডেলটি অন্বেষণ করেছি, এর ইনপুট এবং আউটপুটগুলি সম্পর্কে শিখেছি, এবং বিকৃত এআই-জেনারেটেড ফটোগুলিকে ঠিক করতে কীভাবে এটি ব্যবহার করতে হয় তা প্রদর্শন করেছি৷ অনুরূপ মডেলগুলি খুঁজে পেতে এবং তাদের আউটপুটগুলির তুলনা করার জন্য প্রতিলিপি কোডেক্সে অনুসন্ধান এবং ফিল্টার বৈশিষ্ট্যগুলি কীভাবে লাভ করা যায় তাও আমরা আলোচনা করেছি, যা আমাদের এআই-চালিত চিত্র বর্ধন এবং পুনরুদ্ধারের জগতে আমাদের দিগন্তকে প্রসারিত করার অনুমতি দেয়।
আমি আশা করি এই নির্দেশিকা আপনাকে AI এর সৃজনশীল সম্ভাবনাগুলি অন্বেষণ করতে এবং আপনার কল্পনাকে জীবন্ত করতে অনুপ্রাণিত করেছে। পড়ার জন্য ধন্যবাদ. রেপ্লিকেট কোডেক্সের সাথে AI এর জগতকে উন্নত ও অন্বেষণ করা শুভ ইমেজ!
এছাড়াও এখানে প্রকাশিত