এআই ইমেজ রিস্টোরেশনের ওয়ার্ল্ডের মাধ্যমে একটি হ্যান্ডস-অন জার্নি  কখনও কখনও, এআই-জেনারেটেড ফটোগুলি কিছুটা বেরিয়ে আসে... অস্বস্তিকর। হতে পারে সেগুলি নিম্নমানের, বা সম্ভবত এমন অদ্ভুত শিল্পকর্ম রয়েছে যা চিত্রটিকে নিখুঁত থেকে কম দেখায়৷ কিন্তু ভয় নেই! কোডফর্মার দিনটি বাঁচাতে এখানে রয়েছে, আপনাকে সেই ছবিগুলিকে অল্প সময়ের মধ্যে ঠিক করতে সহায়তা করে৷ এই নির্দেশিকায়, আমি আপনাকে CodeFormer মডেলের সাথে পরিচয় করিয়ে দেব, এটি কীভাবে কাজ করে তা দেখাব এবং একটি সামান্য বিকৃত এআই-জেনারেটেড ফটো ঠিক করতে কীভাবে এটি ব্যবহার করবেন তা ব্যাখ্যা করব। নীচে দেখানো অন্য এআই মডেল থেকে আমি যে অদ্ভুত ইমেজটি পেয়েছি তা পরিষ্কার করার জন্য আমি সঠিক পদক্ষেপগুলি নিয়ে আপনাকে হাঁটব:   এই ছবিটি থেকে এসেছে  মডেল, যা আমি অন্য ব্লগ পোস্টের জন্য ব্যবহার করছিলাম। আমি আপনাকে দেখাব কিভাবে আপনি একই ওয়ার্কফ্লো ব্যবহার করতে পারেন যা আমি অনুসরণ করেছি আপনার নিজের তৈরি করা ছবিগুলি পরিষ্কার করতে এবং এমনকি আরও ভাল দেখতে সেগুলিকে আপস্কেল করতে। আমি রেপ্লিকেট পাইথন SDK ব্যবহার করে এই ওয়াকথ্রুটি করব, তবে আরও অনেক ভাষা সমর্থিত আছে  .   arcane-প্রসারণ   প্রতিলিপি উপর  এই গাইডে, আমি আপনাকে দেখাব কিভাবে আমরা ব্যবহার করতে পারি  অনুরূপ মডেল খুঁজে পেতে এবং আমরা কোনটি পছন্দ করি তা নির্ধারণ করতে। রেপ্লিকেট কোডেক্স হল একটি বিনামূল্যের কমিউনিটি টুল যা আপনাকে AI মডেলগুলি অনুসন্ধান, ফিল্টার, বাছাই এবং তুলনা করতে এবং আপনার AI প্রকল্পের জন্য সঠিকটি খুঁজে পেতে দেয়৷    কোডেক্স প্রতিলিপি  CodeFormer রেপ্লিকেট কোডেক্সে 6 তম স্থানে রয়েছে৷ 8M এর বেশি রান সহ এটি অত্যন্ত জনপ্রিয়। সুতরাং, এটা বলা নিরাপদ যে সম্প্রদায়টি সত্যিই এই টুলটি পছন্দ করে - এবং এর মানে আপনিও এটি ব্যবহার করতে পছন্দ করতে পারেন!  কোডফর্মার সম্পর্কে  CodeFormer, দ্বারা নির্মিত  , একটি শক্তিশালী মুখ পুনরুদ্ধার অ্যালগরিদম যা পুরানো ফটো এবং AI-উত্পাদিত মুখ উভয়ের সাথে কাজ করার জন্য ডিজাইন করা হয়েছে৷ এটি একটি ইমেজ-টু-ইমেজ মডেল যার দাম প্রতি রানে $0.0055, Nvidia T4 GPU হার্ডওয়্যারে গড় রান টাইম 10 সেকেন্ড।   sczhou  CodeFormer-এর অন্তর্নিহিত প্রযুক্তিটি একটি ট্রান্সফরমার-ভিত্তিক ভবিষ্যদ্বাণী নেটওয়ার্কের উপর ভিত্তি করে, যা কোড পূর্বাভাসের জন্য বিশ্বব্যাপী রচনা এবং প্রসঙ্গ মডেল করে। এটি মডেলটিকে প্রাকৃতিক মুখগুলি আবিষ্কার করতে দেয় যা লক্ষ্য মুখগুলির কাছাকাছি আনুমানিক, এমনকি ইনপুটগুলি গুরুতরভাবে অবনমিত হলেও৷ একটি নিয়ন্ত্রণযোগ্য বৈশিষ্ট্য রূপান্তর মডিউলও অন্তর্ভুক্ত করা হয়েছে, যা বিশ্বস্ততা এবং গুণমানের মধ্যে একটি নমনীয় ট্রেড-অফ সক্ষম করে। আপনি CodeFormer কিভাবে কাজ করে সে সম্পর্কে আরও পড়তে পারেন  .   গিথুবে  CodeFormer এর ইনপুট এবং আউটপুট বোঝা  আমরা এই প্রকল্পে কাজ শুরু করার আগে, মডেলটি আশা করা ইনপুট এবং আউটপুটগুলি বুঝতে এক সেকেন্ড সময় নেয়।  ইনপুট    (ফাইল): ইনপুট ইমেজ আপনি ঠিক করতে চান। image    (সংখ্যা): গুণমান (নিম্ন সংখ্যা) এবং বিশ্বস্ততা (উচ্চ সংখ্যা) এর মধ্যে একটি ভারসাম্য। ডিফল্ট মান: 0.5। codeformer_fidelity    (বুলিয়ান): Real-ESRGAN দিয়ে ব্যাকগ্রাউন্ড ইমেজ উন্নত করতে হবে কিনা। ডিফল্ট মান: মিথ্যা। background_enhance    (বুলিয়ান): উচ্চ-রেজোলিউশন AI-তৈরি ইমেজগুলির জন্য পুনরুদ্ধার করা মুখগুলিকে আপস্যাম্পল করতে হবে কিনা৷ ডিফল্ট মান: মিথ্যা। face_upsample    (পূর্ণসংখ্যা): ছবির চূড়ান্ত আপস্যাম্পলিং স্কেল। ডিফল্ট মান: 2। upscale  আউটপুট  মডেলের আউটপুট হল একটি URI স্ট্রিং যা স্থির চিত্রের প্রতিনিধিত্ব করে। এটি একটি JSON অবজেক্ট এবং নীচের বিন্যাসের মতো দেখাচ্ছে:   { "type": "string", "title": "Output", "format": "uri" }  এখন যেহেতু আমরা ইনপুট এবং আউটপুটগুলি বুঝতে পেরেছি, আসুন একটি বিকৃত এআই-জেনারেটেড ফটো ঠিক করতে CodeFormer ব্যবহারে ডুব দেওয়া যাক।  CodeFormer ব্যবহার করার জন্য একটি ধাপে ধাপে নির্দেশিকা  আপনি যদি কোডিংয়ের জন্য প্রস্তুত না হন তবে আপনি কোডফর্মারের "ডেমো" এর সাথে তাদের UI এর মাধ্যমে প্রতিলিপিতে সরাসরি ইন্টারঅ্যাক্ট করতে পারেন। আপনি পারেন  ইন্টারফেসের সাথে সরাসরি যোগাযোগ করতে এবং এটি চেষ্টা করে দেখতে! এটি মডেলের পরামিতিগুলির সাথে খেলার এবং কিছু দ্রুত প্রতিক্রিয়া এবং বৈধতা পাওয়ার একটি চমৎকার উপায়।   এই লিঙ্কটি ব্যবহার করুন  আপনি যদি আরও প্রযুক্তিগত হন এবং শেষ পর্যন্ত CodeFormer-এর উপরে একটি দুর্দান্ত সরঞ্জাম তৈরি করতে চান, তাহলে আপনি প্রতিলিপিতে মডেলটি ব্যবহার করে আপনার চিত্রগুলি পুনরুদ্ধার এবং উন্নত করতে এই সহজ পদক্ষেপগুলি অনুসরণ করতে পারেন।  নিশ্চিত করুন যে আপনার কাছে একটি প্রতিলিপি অ্যাকাউন্ট এবং আপনার API কী সহজে আছে!  ধাপ 1: পাইথন ক্লায়েন্ট ইনস্টল করুন  এটি করা বেশ সহজ:   pip install replicate  ধাপ 2: আপনার API টোকেন সেট আপ করুন  আপনি আপনার অ্যাকাউন্ট ট্যাবে প্রতিলিপি থেকে এটি পেতে পারেন।   export REPLICATE_API_TOKEN=[token]  ধাপ 3: মডেলটি চালান  রেপ্লিকেট পাইথন SDK-এর সাথে এটি করার জন্য আপনাকে শুধু কোডের কয়েকটি লাইনের প্রয়োজন।   import replicate output = replicate.run( "sczhou/codeformer:7de2ea26c616d5bf2245ad0d5e24f0ff9a6204578a5c876db53142edd9d2cd56", input={"image": open("path/to/file", "rb")} ) print(output)  এই ধাপে, আমরা   লাইব্রেরি আমদানি করি এবং প্রদত্ত ইনপুট চিত্র সহ CodeFormer মডেল চালানোর জন্য   ফাংশনটি কল করি। আউটপুটটি একটি URI স্ট্রিং হিসাবে মুদ্রিত হবে যা স্থির চিত্রের প্রতিনিধিত্ব করে। replicate run  এই প্রক্রিয়া থেকে আমি যে আউটপুট ইমেজটি পেয়েছি তা এখানে দেখানো হয়েছে, আমি যে জঘন্য ইনপুট দিয়ে শুরু করেছি তার বিপরীতে দেখানো হয়েছে। কি উন্নতি!   এটিকে আরও এগিয়ে নিয়ে যাওয়া - প্রতিলিপি কোডেক্স সহ অন্যান্য চিত্র পুনরুদ্ধার মডেলগুলি সন্ধান করা  প্রতিলিপি কোডেক্স হল AI মডেলগুলি আবিষ্কার করার জন্য একটি দুর্দান্ত সংস্থান যা বিভিন্ন সৃজনশীল চাহিদা পূরণ করে, যার মধ্যে ইমেজ জেনারেশন, ইমেজ থেকে ইমেজ কনভার্সন এবং আরও অনেক কিছু। এটি একটি সম্পূর্ণরূপে অনুসন্ধানযোগ্য, ফিল্টারযোগ্য, প্রতিলিপিতে থাকা সমস্ত মডেলের ট্যাগ করা ডেটাবেস এবং এটি আপনাকে মডেলগুলির তুলনা করতে এবং মূল্য অনুসারে বাছাই করতে বা নির্মাতার দ্বারা অন্বেষণ করতে দেয়৷ এটি বিনামূল্যে, এবং এটিতে একটি ডাইজেস্ট ইমেলও রয়েছে যা নতুন মডেলগুলি বের হলে আপনাকে সতর্ক করবে যাতে আপনি সেগুলি চেষ্টা করতে পারেন৷  আপনি যদি CodeFormer এর অনুরূপ মডেল খুঁজে পেতে আগ্রহী হন...  ধাপ 1: রেপ্লিকেট কোডেক্স দেখুন  মাথা ওভার  অনুরূপ মডেলের জন্য আপনার অনুসন্ধান শুরু করতে।   কোডেক্স প্রতিলিপি  ধাপ 2: অনুসন্ধান বার ব্যবহার করুন  নির্দিষ্ট কীওয়ার্ড সহ মডেলগুলি অনুসন্ধান করতে পৃষ্ঠার শীর্ষে অনুসন্ধান বারটি ব্যবহার করুন, যেমন "চিত্র পুনরুদ্ধার," "ফেস বর্ধিতকরণ," বা "সুপার-রেজোলিউশন।" এটি আপনাকে আপনার অনুসন্ধান ক্যোয়ারী সম্পর্কিত মডেলগুলির একটি তালিকা দেখাবে৷  ধাপ 3: ফলাফলগুলি ফিল্টার করুন  অনুসন্ধান ফলাফল পৃষ্ঠার ডানদিকে, আপনি বেশ কয়েকটি ফিল্টার পাবেন যা আপনাকে মডেলের তালিকাকে সংকুচিত করতে সাহায্য করতে পারে। আপনি টাইপ (চিত্র থেকে চিত্র, পাঠ্য থেকে চিত্র, ইত্যাদি), খরচ, জনপ্রিয়তা বা এমনকি নির্দিষ্ট নির্মাতাদের দ্বারা মডেলগুলি ফিল্টার এবং বাছাই করতে পারেন৷   এই ফিল্টারগুলি প্রয়োগ করে, আপনি এমন মডেলগুলি খুঁজে পেতে পারেন যা আপনার নির্দিষ্ট চাহিদা এবং পছন্দগুলির সাথে সবচেয়ে উপযুক্ত। উদাহরণস্বরূপ, আপনি যদি একটি চিত্র পুনরুদ্ধার মডেল খুঁজছেন যা সর্বাধিক জনপ্রিয়, আপনি কেবল অনুসন্ধান করতে পারেন এবং তারপর রানের সংখ্যা অনুসারে বাছাই করতে পারেন। সেই ক্ষেত্রে, আপনি GFPGAN মডেলটি পাবেন, যা আমি পুরানো ফটোগুলি পুনরুদ্ধার করতেও ব্যবহার করেছি - দেখুন  আরও তথ্যের জন্য. আমি নীচে GFPGAN থেকে একটি উদাহরণ পুনরুদ্ধার অন্তর্ভুক্ত করেছি যাতে আপনি এটি কীভাবে চিত্রগুলি পরিচালনা করে তা বুঝতে পারেন।    আমার লেখা এখানে  উপসংহার  এই নির্দেশিকাটিতে, আমরা কোডফর্মার মডেলটি অন্বেষণ করেছি, এর ইনপুট এবং আউটপুটগুলি সম্পর্কে শিখেছি, এবং বিকৃত এআই-জেনারেটেড ফটোগুলিকে ঠিক করতে কীভাবে এটি ব্যবহার করতে হয় তা প্রদর্শন করেছি৷ অনুরূপ মডেলগুলি খুঁজে পেতে এবং তাদের আউটপুটগুলির তুলনা করার জন্য প্রতিলিপি কোডেক্সে অনুসন্ধান এবং ফিল্টার বৈশিষ্ট্যগুলি কীভাবে লাভ করা যায় তাও আমরা আলোচনা করেছি, যা আমাদের এআই-চালিত চিত্র বর্ধন এবং পুনরুদ্ধারের জগতে আমাদের দিগন্তকে প্রসারিত করার অনুমতি দেয়।  আমি আশা করি এই নির্দেশিকা আপনাকে AI এর সৃজনশীল সম্ভাবনাগুলি অন্বেষণ করতে এবং আপনার কল্পনাকে জীবন্ত করতে অনুপ্রাণিত করেছে। পড়ার জন্য ধন্যবাদ. রেপ্লিকেট কোডেক্সের সাথে AI এর জগতকে উন্নত ও অন্বেষণ করা শুভ ইমেজ!  এছাড়াও   প্রকাশিত এখানে

This story contains new, firsthand information uncovered by the writer.

Tell me why my site sucks so I can make it better. Be mean.

Read My Stories

গল্পের মূল ভাষায় এই অডিও তৈরি!

কোডফর্মারের সাহায্যে এআই-জেনারেটেড মনস্ট্রোসিটিগুলিকে মানুষে পরিণত করা

About Author

মন্তব্য

আসে ট্যাগ

এই নিবন্ধটি উপস্থাপন করা হয়েছে

Related Stories

ব্যবহারকারী-কেন্দ্রিক ক্রিপ্টো পণ্য তৈরি করা: গ্রাহক প্রতিক্রিয়ার গুরুত্ব

ক্লাউড সনেট 3.5 সিস্টেম প্রম্পট লিক: একটি ফরেনসিক বিশ্লেষণ

টেলিগ্রাম: ক্রিপ্টো দ্বীপের মূল ভূখণ্ডের সেতু

ফোরাম থেকে ফিড পর্যন্ত: কীভাবে সোশ্যাল মিডিয়া অ্যালগরিদম ডিজিটাল ইন্টারঅ্যাকশনকে আকার দেয়

ব্যবহারকারী-কেন্দ্রিক ক্রিপ্টো পণ্য তৈরি করা: গ্রাহক প্রতিক্রিয়ার গুরুত্ব

ক্লাউড সনেট 3.5 সিস্টেম প্রম্পট লিক: একটি ফরেনসিক বিশ্লেষণ

টেলিগ্রাম: ক্রিপ্টো দ্বীপের মূল ভূখণ্ডের সেতু

ফোরাম থেকে ফিড পর্যন্ত: কীভাবে সোশ্যাল মিডিয়া অ্যালগরিদম ডিজিটাল ইন্টারঅ্যাকশনকে আকার দেয়

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps