লেখক:
(1) কেদান লি, আরবানা-চ্যাম্পেইনের ইলিনয় বিশ্ববিদ্যালয়;
(২) মিন জিন চং, ইউনিভার্সিটি অফ ইলিনয় অ্যাট আরবানা-চ্যাম্পেইন;
(3) জিনজেন লিউ, জেডি এআই গবেষণা;
(4) ডেভিড ফোরসিথ, আরবানা-চ্যাম্পেইনের ইলিনয় বিশ্ববিদ্যালয়।
আমাদের পদ্ধতি দুটি উপাদান আছে. একটি শেপ ম্যাচিং নেট (SMN; চিত্র 2 এবং 3) স্থানান্তর করার জন্য আকৃতি অনুসারে সামঞ্জস্যপূর্ণ পোশাক-মডেল জোড়া বেছে নেওয়ার জন্য একটি এমবেডিং শেখে। এম্বেডিং স্পেসে কাছাকাছি থাকা প্রোডাক্ট (resp. মডেল) ইমেজ খোঁজার মাধ্যমে প্রোডাক্ট এবং মডেল ইমেজ মিলিত হয়। একটি মাল্টি-ওয়ার্প ট্রাই-অন নেট (MTN; চিত্র 4) একটি গার্মেন্ট ইমেজ, একটি মডেল ইমেজ এবং একটি মুখোশ ধারণ করে যা মডেলের পোশাক পরিবর্তন করার জন্য আবরণ করে এবং প্রদত্ত পোশাক পরা মডেলের একটি বাস্তবসম্মত সংশ্লেষণ চিত্র তৈরি করে। নেটওয়ার্কটি একটি ওয়ারপার এবং একটি ইনপেইন্টিং নেটওয়ার্ক নিয়ে গঠিত, যা যৌথভাবে প্রশিক্ষিত। ওয়ারপার পণ্যের চিত্রের k warps তৈরি করে, প্রতিটি নির্দিষ্ট বৈশিষ্ট্যের উপর বিশেষ। ইনপেইন্টিং নেটওয়ার্ক প্রতিটি ওয়ার্প থেকে কোন বৈশিষ্ট্যগুলি সন্ধান করতে হবে তা বেছে নিয়ে ওয়ার্পগুলিকে একত্রিত করতে শেখে। SMN এবং MTN আলাদাভাবে প্রশিক্ষিত।
এমবেডিং ক্ষতি দুটি ডোমেনের বৈশিষ্ট্য চিঠিপত্র ক্যাপচার করতে এবং নেটওয়ার্ক আর্কিটেকচারে এম্বেড করা মনোযোগের প্রক্রিয়া প্রয়োগ করতে সহায়তা করতে ব্যবহৃত হয়। স্থানিক মনোযোগের আর্কিটেকচার সম্পর্কে বিশদ পরিপূরক উপকরণগুলিতে রয়েছে।
পূর্বের কাজের [১৭,৪৫] মতো, আমাদের সিস্টেমেও দুটি মডিউল রয়েছে: (ক) একটি ওয়ারপার একাধিক বিশেষায়িত ওয়ার্প তৈরি করতে, পণ্যের চিত্রটিকে মুখোশের সাথে সারিবদ্ধ করে; (b) মুখোশযুক্ত মডেলের সাথে ওয়ার্পসকে একত্রিত করতে এবং সংশ্লেষণ চিত্র তৈরি করার জন্য একটি ইনপেইন্টিং মডিউল। পূর্ববর্তী কাজের [17,45] থেকে ভিন্ন, দুটি মডিউল আলাদাভাবে না হয়ে যৌথভাবে প্রশিক্ষিত হয়, তাই ইনপেইন্টার ওয়ারপারকে গাইড করে।
ক্যাসকেড লস: একাধিক ওয়ার্প সহ, প্রতিটি ওয়ার্প ওয়ার্পকে পূর্ববর্তী ওয়ার্পগুলির দ্বারা করা ভুলগুলি সমাধান করার জন্য প্রশিক্ষণ দেওয়া হয় wj যেখানে j < i৷ k তম ওয়ার্পের জন্য, আমরা প্রতি পিক্সেলে পূর্ববর্তী সমস্ত ওয়ার্পগুলির মধ্যে সর্বনিম্ন ক্ষতি গণনা করি, এইভাবে লেখা
ক্যাসকেড লস সমস্ত ওয়ারপের গড় ক্ষতি গণনা করে। একটি অতিরিক্ত নিয়মিতকরণ শর্তাবলী রূপান্তর পরামিতিগুলিতে প্রয়োগ করা হয়, তাই পরবর্তী সমস্ত ওয়ার্পগুলি প্রথম ওয়ার্পের কাছাকাছি থাকে।
ক্যাসকেড লস সমস্ত ওয়ার্পগুলির মধ্যে একটি শ্রেণীবিন্যাস প্রয়োগ করে, যা পরবর্তী ওয়ার্পের চেয়ে আগের ওয়ার্পের জন্য ভুল করা আরও ব্যয়বহুল করে তোলে। এটি প্রশিক্ষণের সময় সম্ভাব্য দোলনকে প্রতিরোধ করে (একাধিক ওয়ারপ সর্বোত্তম জন্য প্রতিযোগিতা করে)। ধারণাটি বুস্টিংয়ের সাথে তুলনীয়, তবে এখনও ভিন্ন কারণ সমস্ত ওয়ার্প গ্রেডিয়েন্ট ভাগ করে, যা পূর্ববর্তী ওয়ার্পগুলির জন্য পরবর্তী ওয়ার্পগুলির সাথে সামঞ্জস্য করা সম্ভব করে।
এই কাগজটি CC BY-NC-SA 4.0 DEED লাইসেন্সের অধীনে arxiv-এ উপলব্ধ ।