paint-brush
শেপ ম্যাচিং এর মাধ্যমে সঠিক, বাস্তবসম্মত ভার্চুয়াল ট্রাই-অন: প্রস্তাবিত পদ্ধতিদ্বারা@polyframe
212 পড়া

শেপ ম্যাচিং এর মাধ্যমে সঠিক, বাস্তবসম্মত ভার্চুয়াল ট্রাই-অন: প্রস্তাবিত পদ্ধতি

দ্বারা Polyframe Peer Reviewed Publication2m2024/06/08
Read on Terminal Reader

অতিদীর্ঘ; পড়তে

গবেষকরা একটি নতুন ডেটাসেট ব্যবহার করে টার্গেট মডেল বেছে নেওয়ার মাধ্যমে ভার্চুয়াল ট্রাই-অন পদ্ধতি উন্নত করে এবং বিশেষ ওয়ারপারদের প্রশিক্ষণ দেয়, বাস্তববাদ এবং নির্ভুলতা বৃদ্ধি করে।
featured image - শেপ ম্যাচিং এর মাধ্যমে সঠিক, বাস্তবসম্মত ভার্চুয়াল ট্রাই-অন: প্রস্তাবিত পদ্ধতি
Polyframe Peer Reviewed Publication HackerNoon profile picture
0-item

লেখক:

(1) কেদান লি, আরবানা-চ্যাম্পেইনের ইলিনয় বিশ্ববিদ্যালয়;

(২) মিন জিন চং, ইউনিভার্সিটি অফ ইলিনয় অ্যাট আরবানা-চ্যাম্পেইন;

(3) জিনজেন লিউ, জেডি এআই গবেষণা;

(4) ডেভিড ফোরসিথ, আরবানা-চ্যাম্পেইনের ইলিনয় বিশ্ববিদ্যালয়।

লিঙ্কের টেবিল

3. প্রস্তাবিত পদ্ধতি

আমাদের পদ্ধতি দুটি উপাদান আছে. একটি শেপ ম্যাচিং নেট (SMN; চিত্র 2 এবং 3) স্থানান্তর করার জন্য আকৃতি অনুসারে সামঞ্জস্যপূর্ণ পোশাক-মডেল জোড়া বেছে নেওয়ার জন্য একটি এমবেডিং শেখে। এম্বেডিং স্পেসে কাছাকাছি থাকা প্রোডাক্ট (resp. মডেল) ইমেজ খোঁজার মাধ্যমে প্রোডাক্ট এবং মডেল ইমেজ মিলিত হয়। একটি মাল্টি-ওয়ার্প ট্রাই-অন নেট (MTN; চিত্র 4) একটি গার্মেন্ট ইমেজ, একটি মডেল ইমেজ এবং একটি মুখোশ ধারণ করে যা মডেলের পোশাক পরিবর্তন করার জন্য আবরণ করে এবং প্রদত্ত পোশাক পরা মডেলের একটি বাস্তবসম্মত সংশ্লেষণ চিত্র তৈরি করে। নেটওয়ার্কটি একটি ওয়ারপার এবং একটি ইনপেইন্টিং নেটওয়ার্ক নিয়ে গঠিত, যা যৌথভাবে প্রশিক্ষিত। ওয়ারপার পণ্যের চিত্রের k warps তৈরি করে, প্রতিটি নির্দিষ্ট বৈশিষ্ট্যের উপর বিশেষ। ইনপেইন্টিং নেটওয়ার্ক প্রতিটি ওয়ার্প থেকে কোন বৈশিষ্ট্যগুলি সন্ধান করতে হবে তা বেছে নিয়ে ওয়ার্পগুলিকে একত্রিত করতে শেখে। SMN এবং MTN আলাদাভাবে প্রশিক্ষিত।


3.1 শেপ ম্যাচিং নেট



এমবেডিং ক্ষতি দুটি ডোমেনের বৈশিষ্ট্য চিঠিপত্র ক্যাপচার করতে এবং নেটওয়ার্ক আর্কিটেকচারে এম্বেড করা মনোযোগের প্রক্রিয়া প্রয়োগ করতে সহায়তা করতে ব্যবহৃত হয়। স্থানিক মনোযোগের আর্কিটেকচার সম্পর্কে বিশদ পরিপূরক উপকরণগুলিতে রয়েছে।


3.2 মাল্টি-ওয়ার্প ট্রাই-অন নেট


পূর্বের কাজের [১৭,৪৫] মতো, আমাদের সিস্টেমেও দুটি মডিউল রয়েছে: (ক) একটি ওয়ারপার একাধিক বিশেষায়িত ওয়ার্প তৈরি করতে, পণ্যের চিত্রটিকে মুখোশের সাথে সারিবদ্ধ করে; (b) মুখোশযুক্ত মডেলের সাথে ওয়ার্পসকে একত্রিত করতে এবং সংশ্লেষণ চিত্র তৈরি করার জন্য একটি ইনপেইন্টিং মডিউল। পূর্ববর্তী কাজের [17,45] থেকে ভিন্ন, দুটি মডিউল আলাদাভাবে না হয়ে যৌথভাবে প্রশিক্ষিত হয়, তাই ইনপেইন্টার ওয়ারপারকে গাইড করে।





ক্যাসকেড লস: একাধিক ওয়ার্প সহ, প্রতিটি ওয়ার্প ওয়ার্পকে পূর্ববর্তী ওয়ার্পগুলির দ্বারা করা ভুলগুলি সমাধান করার জন্য প্রশিক্ষণ দেওয়া হয় wj যেখানে j < i৷ k তম ওয়ার্পের জন্য, আমরা প্রতি পিক্সেলে পূর্ববর্তী সমস্ত ওয়ার্পগুলির মধ্যে সর্বনিম্ন ক্ষতি গণনা করি, এইভাবে লেখা



ক্যাসকেড লস সমস্ত ওয়ারপের গড় ক্ষতি গণনা করে। একটি অতিরিক্ত নিয়মিতকরণ শর্তাবলী রূপান্তর পরামিতিগুলিতে প্রয়োগ করা হয়, তাই পরবর্তী সমস্ত ওয়ার্পগুলি প্রথম ওয়ার্পের কাছাকাছি থাকে।



ক্যাসকেড লস সমস্ত ওয়ার্পগুলির মধ্যে একটি শ্রেণীবিন্যাস প্রয়োগ করে, যা পরবর্তী ওয়ার্পের চেয়ে আগের ওয়ার্পের জন্য ভুল করা আরও ব্যয়বহুল করে তোলে। এটি প্রশিক্ষণের সময় সম্ভাব্য দোলনকে প্রতিরোধ করে (একাধিক ওয়ারপ সর্বোত্তম জন্য প্রতিযোগিতা করে)। ধারণাটি বুস্টিংয়ের সাথে তুলনীয়, তবে এখনও ভিন্ন কারণ সমস্ত ওয়ার্প গ্রেডিয়েন্ট ভাগ করে, যা পূর্ববর্তী ওয়ার্পগুলির জন্য পরবর্তী ওয়ার্পগুলির সাথে সামঞ্জস্য করা সম্ভব করে।



এই কাগজটি CC BY-NC-SA 4.0 DEED লাইসেন্সের অধীনে arxiv-এ উপলব্ধ