paint-brush
কোডফর্মারের সাহায্যে এআই-জেনারেটেড মনস্ট্রোসিটিগুলিকে মানুষে পরিণত করাদ্বারা@mikeyoung44
4,730 পড়া
4,730 পড়া

কোডফর্মারের সাহায্যে এআই-জেনারেটেড মনস্ট্রোসিটিগুলিকে মানুষে পরিণত করা

দ্বারা Mike Young5m2023/04/12
Read on Terminal Reader
Read this story w/o Javascript

অতিদীর্ঘ; পড়তে

CodeFormer হল একটি মজবুত ফেস রিস্টোরেশন অ্যালগরিদম যা পুরানো ফটো এবং এআই-জেনারেট করা মুখের সাথে কাজ করার জন্য ডিজাইন করা হয়েছে। এটি একটি ইমেজ-টু-ইমেজ মডেল যার দাম প্রতি রানে $0.0055, Nvidia T4 GPU হার্ডওয়্যারে গড় রান টাইম 10 সেকেন্ড। CodeFormer-এর অন্তর্নিহিত প্রযুক্তি একটি ট্রান্সফরমার-ভিত্তিক ভবিষ্যদ্বাণী নেটওয়ার্কের উপর ভিত্তি করে।

People Mentioned

Mention Thumbnail
featured image - কোডফর্মারের সাহায্যে এআই-জেনারেটেড মনস্ট্রোসিটিগুলিকে মানুষে পরিণত করা
Mike Young HackerNoon profile picture
0-item

এআই ইমেজ রিস্টোরেশনের ওয়ার্ল্ডের মাধ্যমে একটি হ্যান্ডস-অন জার্নি

কখনও কখনও, এআই-জেনারেটেড ফটোগুলি কিছুটা বেরিয়ে আসে... অস্বস্তিকর। হতে পারে সেগুলি নিম্নমানের, বা সম্ভবত এমন অদ্ভুত শিল্পকর্ম রয়েছে যা চিত্রটিকে নিখুঁত থেকে কম দেখায়৷ কিন্তু ভয় নেই! কোডফর্মার দিনটি বাঁচাতে এখানে রয়েছে, আপনাকে সেই ছবিগুলিকে অল্প সময়ের মধ্যে ঠিক করতে সহায়তা করে৷ এই নির্দেশিকায়, আমি আপনাকে CodeFormer মডেলের সাথে পরিচয় করিয়ে দেব, এটি কীভাবে কাজ করে তা দেখাব এবং একটি সামান্য বিকৃত এআই-জেনারেটেড ফটো ঠিক করতে কীভাবে এটি ব্যবহার করবেন তা ব্যাখ্যা করব। নীচে দেখানো অন্য এআই মডেল থেকে আমি যে অদ্ভুত ইমেজটি পেয়েছি তা পরিষ্কার করার জন্য আমি সঠিক পদক্ষেপগুলি নিয়ে আপনাকে হাঁটব:


এই ছেলে ভয়ানক এবং ভীতিকর দেখায়. Arcane-diffusion থেকে আসল প্রজন্ম।


এই ছবিটি থেকে এসেছে arcane-প্রসারণ মডেল, যা আমি অন্য ব্লগ পোস্টের জন্য ব্যবহার করছিলাম। আমি আপনাকে দেখাব কিভাবে আপনি একই ওয়ার্কফ্লো ব্যবহার করতে পারেন যা আমি অনুসরণ করেছি আপনার নিজের তৈরি করা ছবিগুলি পরিষ্কার করতে এবং এমনকি আরও ভাল দেখতে সেগুলিকে আপস্কেল করতে। আমি রেপ্লিকেট পাইথন SDK ব্যবহার করে এই ওয়াকথ্রুটি করব, তবে আরও অনেক ভাষা সমর্থিত আছে প্রতিলিপি উপর .


এই গাইডে, আমি আপনাকে দেখাব কিভাবে আমরা ব্যবহার করতে পারি কোডেক্স প্রতিলিপি অনুরূপ মডেল খুঁজে পেতে এবং আমরা কোনটি পছন্দ করি তা নির্ধারণ করতে। রেপ্লিকেট কোডেক্স হল একটি বিনামূল্যের কমিউনিটি টুল যা আপনাকে AI মডেলগুলি অনুসন্ধান, ফিল্টার, বাছাই এবং তুলনা করতে এবং আপনার AI প্রকল্পের জন্য সঠিকটি খুঁজে পেতে দেয়৷


CodeFormer হল Replicate Codex-এর অন্যতম জনপ্রিয় মডেল


CodeFormer রেপ্লিকেট কোডেক্সে 6 তম স্থানে রয়েছে৷ 8M এর বেশি রান সহ এটি অত্যন্ত জনপ্রিয়। সুতরাং, এটা বলা নিরাপদ যে সম্প্রদায়টি সত্যিই এই টুলটি পছন্দ করে - এবং এর মানে আপনিও এটি ব্যবহার করতে পছন্দ করতে পারেন!

কোডফর্মার সম্পর্কে

CodeFormer, দ্বারা নির্মিত sczhou , একটি শক্তিশালী মুখ পুনরুদ্ধার অ্যালগরিদম যা পুরানো ফটো এবং AI-উত্পাদিত মুখ উভয়ের সাথে কাজ করার জন্য ডিজাইন করা হয়েছে৷ এটি একটি ইমেজ-টু-ইমেজ মডেল যার দাম প্রতি রানে $0.0055, Nvidia T4 GPU হার্ডওয়্যারে গড় রান টাইম 10 সেকেন্ড।


CodeFormer-এর অন্তর্নিহিত প্রযুক্তিটি একটি ট্রান্সফরমার-ভিত্তিক ভবিষ্যদ্বাণী নেটওয়ার্কের উপর ভিত্তি করে, যা কোড পূর্বাভাসের জন্য বিশ্বব্যাপী রচনা এবং প্রসঙ্গ মডেল করে। এটি মডেলটিকে প্রাকৃতিক মুখগুলি আবিষ্কার করতে দেয় যা লক্ষ্য মুখগুলির কাছাকাছি আনুমানিক, এমনকি ইনপুটগুলি গুরুতরভাবে অবনমিত হলেও৷ একটি নিয়ন্ত্রণযোগ্য বৈশিষ্ট্য রূপান্তর মডিউলও অন্তর্ভুক্ত করা হয়েছে, যা বিশ্বস্ততা এবং গুণমানের মধ্যে একটি নমনীয় ট্রেড-অফ সক্ষম করে। আপনি CodeFormer কিভাবে কাজ করে সে সম্পর্কে আরও পড়তে পারেন গিথুবে .

CodeFormer এর ইনপুট এবং আউটপুট বোঝা

আমরা এই প্রকল্পে কাজ শুরু করার আগে, মডেলটি আশা করা ইনপুট এবং আউটপুটগুলি বুঝতে এক সেকেন্ড সময় নেয়।

ইনপুট

  1. image (ফাইল): ইনপুট ইমেজ আপনি ঠিক করতে চান।
  2. codeformer_fidelity (সংখ্যা): গুণমান (নিম্ন সংখ্যা) এবং বিশ্বস্ততা (উচ্চ সংখ্যা) এর মধ্যে একটি ভারসাম্য। ডিফল্ট মান: 0.5।
  3. background_enhance (বুলিয়ান): Real-ESRGAN দিয়ে ব্যাকগ্রাউন্ড ইমেজ উন্নত করতে হবে কিনা। ডিফল্ট মান: মিথ্যা।
  4. face_upsample (বুলিয়ান): উচ্চ-রেজোলিউশন AI-তৈরি ইমেজগুলির জন্য পুনরুদ্ধার করা মুখগুলিকে আপস্যাম্পল করতে হবে কিনা৷ ডিফল্ট মান: মিথ্যা।
  5. upscale (পূর্ণসংখ্যা): ছবির চূড়ান্ত আপস্যাম্পলিং স্কেল। ডিফল্ট মান: 2।

আউটপুট

মডেলের আউটপুট হল একটি URI স্ট্রিং যা স্থির চিত্রের প্রতিনিধিত্ব করে। এটি একটি JSON অবজেক্ট এবং নীচের বিন্যাসের মতো দেখাচ্ছে:

 { "type": "string", "title": "Output", "format": "uri" }

এখন যেহেতু আমরা ইনপুট এবং আউটপুটগুলি বুঝতে পেরেছি, আসুন একটি বিকৃত এআই-জেনারেটেড ফটো ঠিক করতে CodeFormer ব্যবহারে ডুব দেওয়া যাক।

CodeFormer ব্যবহার করার জন্য একটি ধাপে ধাপে নির্দেশিকা

আপনি যদি কোডিংয়ের জন্য প্রস্তুত না হন তবে আপনি কোডফর্মারের "ডেমো" এর সাথে তাদের UI এর মাধ্যমে প্রতিলিপিতে সরাসরি ইন্টারঅ্যাক্ট করতে পারেন। আপনি পারেন এই লিঙ্কটি ব্যবহার করুন ইন্টারফেসের সাথে সরাসরি যোগাযোগ করতে এবং এটি চেষ্টা করে দেখতে! এটি মডেলের পরামিতিগুলির সাথে খেলার এবং কিছু দ্রুত প্রতিক্রিয়া এবং বৈধতা পাওয়ার একটি চমৎকার উপায়।


আপনি যদি আরও প্রযুক্তিগত হন এবং শেষ পর্যন্ত CodeFormer-এর উপরে একটি দুর্দান্ত সরঞ্জাম তৈরি করতে চান, তাহলে আপনি প্রতিলিপিতে মডেলটি ব্যবহার করে আপনার চিত্রগুলি পুনরুদ্ধার এবং উন্নত করতে এই সহজ পদক্ষেপগুলি অনুসরণ করতে পারেন।

নিশ্চিত করুন যে আপনার কাছে একটি প্রতিলিপি অ্যাকাউন্ট এবং আপনার API কী সহজে আছে!

ধাপ 1: পাইথন ক্লায়েন্ট ইনস্টল করুন

এটি করা বেশ সহজ:

 pip install replicate

ধাপ 2: আপনার API টোকেন সেট আপ করুন

আপনি আপনার অ্যাকাউন্ট ট্যাবে প্রতিলিপি থেকে এটি পেতে পারেন।

 export REPLICATE_API_TOKEN=[token]

ধাপ 3: মডেলটি চালান

রেপ্লিকেট পাইথন SDK-এর সাথে এটি করার জন্য আপনাকে শুধু কোডের কয়েকটি লাইনের প্রয়োজন।


 import replicate output = replicate.run( "sczhou/codeformer:7de2ea26c616d5bf2245ad0d5e24f0ff9a6204578a5c876db53142edd9d2cd56", input={"image": open("path/to/file", "rb")} ) print(output)


এই ধাপে, আমরা replicate লাইব্রেরি আমদানি করি এবং প্রদত্ত ইনপুট চিত্র সহ CodeFormer মডেল চালানোর জন্য run ফাংশনটি কল করি। আউটপুটটি একটি URI স্ট্রিং হিসাবে মুদ্রিত হবে যা স্থির চিত্রের প্রতিনিধিত্ব করে।


এই প্রক্রিয়া থেকে আমি যে আউটপুট ইমেজটি পেয়েছি তা এখানে দেখানো হয়েছে, আমি যে জঘন্য ইনপুট দিয়ে শুরু করেছি তার বিপরীতে দেখানো হয়েছে। কি উন্নতি!


বাহ, এই মাইল ভাল দেখায়. CodeFormer ব্যবহার করে আগে (বামে) এবং পরে (ডান) ছবি।


এটিকে আরও এগিয়ে নিয়ে যাওয়া - প্রতিলিপি কোডেক্স সহ অন্যান্য চিত্র পুনরুদ্ধার মডেলগুলি সন্ধান করা

প্রতিলিপি কোডেক্স হল AI মডেলগুলি আবিষ্কার করার জন্য একটি দুর্দান্ত সংস্থান যা বিভিন্ন সৃজনশীল চাহিদা পূরণ করে, যার মধ্যে ইমেজ জেনারেশন, ইমেজ থেকে ইমেজ কনভার্সন এবং আরও অনেক কিছু। এটি একটি সম্পূর্ণরূপে অনুসন্ধানযোগ্য, ফিল্টারযোগ্য, প্রতিলিপিতে থাকা সমস্ত মডেলের ট্যাগ করা ডেটাবেস এবং এটি আপনাকে মডেলগুলির তুলনা করতে এবং মূল্য অনুসারে বাছাই করতে বা নির্মাতার দ্বারা অন্বেষণ করতে দেয়৷ এটি বিনামূল্যে, এবং এটিতে একটি ডাইজেস্ট ইমেলও রয়েছে যা নতুন মডেলগুলি বের হলে আপনাকে সতর্ক করবে যাতে আপনি সেগুলি চেষ্টা করতে পারেন৷


আপনি যদি CodeFormer এর অনুরূপ মডেল খুঁজে পেতে আগ্রহী হন...

ধাপ 1: রেপ্লিকেট কোডেক্স দেখুন

মাথা ওভার কোডেক্স প্রতিলিপি অনুরূপ মডেলের জন্য আপনার অনুসন্ধান শুরু করতে।

ধাপ 2: অনুসন্ধান বার ব্যবহার করুন

নির্দিষ্ট কীওয়ার্ড সহ মডেলগুলি অনুসন্ধান করতে পৃষ্ঠার শীর্ষে অনুসন্ধান বারটি ব্যবহার করুন, যেমন "চিত্র পুনরুদ্ধার," "ফেস বর্ধিতকরণ," বা "সুপার-রেজোলিউশন।" এটি আপনাকে আপনার অনুসন্ধান ক্যোয়ারী সম্পর্কিত মডেলগুলির একটি তালিকা দেখাবে৷

ধাপ 3: ফলাফলগুলি ফিল্টার করুন

অনুসন্ধান ফলাফল পৃষ্ঠার ডানদিকে, আপনি বেশ কয়েকটি ফিল্টার পাবেন যা আপনাকে মডেলের তালিকাকে সংকুচিত করতে সাহায্য করতে পারে। আপনি টাইপ (চিত্র থেকে চিত্র, পাঠ্য থেকে চিত্র, ইত্যাদি), খরচ, জনপ্রিয়তা বা এমনকি নির্দিষ্ট নির্মাতাদের দ্বারা মডেলগুলি ফিল্টার এবং বাছাই করতে পারেন৷


রেপ্লিকেট কোডেক্স-এ সবচেয়ে জনপ্রিয় পুনরুদ্ধার মডেলগুলি খোঁজা।


এই ফিল্টারগুলি প্রয়োগ করে, আপনি এমন মডেলগুলি খুঁজে পেতে পারেন যা আপনার নির্দিষ্ট চাহিদা এবং পছন্দগুলির সাথে সবচেয়ে উপযুক্ত। উদাহরণস্বরূপ, আপনি যদি একটি চিত্র পুনরুদ্ধার মডেল খুঁজছেন যা সর্বাধিক জনপ্রিয়, আপনি কেবল অনুসন্ধান করতে পারেন এবং তারপর রানের সংখ্যা অনুসারে বাছাই করতে পারেন। সেই ক্ষেত্রে, আপনি GFPGAN মডেলটি পাবেন, যা আমি পুরানো ফটোগুলি পুনরুদ্ধার করতেও ব্যবহার করেছি - দেখুন আমার লেখা এখানে আরও তথ্যের জন্য. আমি নীচে GFPGAN থেকে একটি উদাহরণ পুনরুদ্ধার অন্তর্ভুক্ত করেছি যাতে আপনি এটি কীভাবে চিত্রগুলি পরিচালনা করে তা বুঝতে পারেন।

একটি উদাহরণ GFPGAN আউটপুট - আমি এটি পুরানো ফটোতে আরও ভাল কাজ করে বলে মনে করি।


উপসংহার

এই নির্দেশিকাটিতে, আমরা কোডফর্মার মডেলটি অন্বেষণ করেছি, এর ইনপুট এবং আউটপুটগুলি সম্পর্কে শিখেছি, এবং বিকৃত এআই-জেনারেটেড ফটোগুলিকে ঠিক করতে কীভাবে এটি ব্যবহার করতে হয় তা প্রদর্শন করেছি৷ অনুরূপ মডেলগুলি খুঁজে পেতে এবং তাদের আউটপুটগুলির তুলনা করার জন্য প্রতিলিপি কোডেক্সে অনুসন্ধান এবং ফিল্টার বৈশিষ্ট্যগুলি কীভাবে লাভ করা যায় তাও আমরা আলোচনা করেছি, যা আমাদের এআই-চালিত চিত্র বর্ধন এবং পুনরুদ্ধারের জগতে আমাদের দিগন্তকে প্রসারিত করার অনুমতি দেয়।


আমি আশা করি এই নির্দেশিকা আপনাকে AI এর সৃজনশীল সম্ভাবনাগুলি অন্বেষণ করতে এবং আপনার কল্পনাকে জীবন্ত করতে অনুপ্রাণিত করেছে। পড়ার জন্য ধন্যবাদ. রেপ্লিকেট কোডেক্সের সাথে AI এর জগতকে উন্নত ও অন্বেষণ করা শুভ ইমেজ!


এছাড়াও এখানে প্রকাশিত