লেখক:
(1) কেদান লি, আরবানা-চ্যাম্পেইনের ইলিনয় বিশ্ববিদ্যালয়;
(2) মিন জিন চং, ইউনিভার্সিটি অফ ইলিনয় অ্যাট আরবানা-চ্যাম্পেইন;
(3) জিনজেন লিউ, জেডি এআই গবেষণা;
(4) ডেভিড ফোরসিথ, আরবানা-চ্যাম্পেইনের ইলিনয় বিশ্ববিদ্যালয়।
এই কাগজে, আমরা ভার্চুয়াল ট্রাই-অন ফ্রেমওয়ার্কে দুটি সাধারণ পরিবর্তনের প্রস্তাব দিই: (ক) একটি আকৃতি এমবেডিং ব্যবহার করে স্থানান্তরের জন্য পণ্য-মডেল জোড়া সাবধানে বেছে নিন এবং (খ) ইনপেইন্টিং ব্যবহার করে একাধিক সমন্বিত ওয়ার্পসকে একত্রিত করুন৷ আমাদের ফলাফলগুলি দেখায় যে উভয় পরিবর্তনই প্রজন্মের মানের উল্লেখযোগ্য উন্নতির দিকে পরিচালিত করে। গুণগত উদাহরণগুলি পোশাকের বিবরণ সঠিকভাবে সংরক্ষণ করার আমাদের ক্ষমতা প্রদর্শন করে। এর ফলে ক্রেতাদের বাস্তব এবং সংশ্লেষিত মডেলের ছবির মধ্যে পার্থক্য করতে অসুবিধা হয়, যা ব্যবহারকারীর অধ্যয়নের ফলাফল দ্বারা দেখানো হয়েছে।
আল্প গুলার, আর., নেভেরোভা, এন., কোকিনোস, আই.: ঘনত্ব: বন্যের মধ্যে ঘন মানুষের পোজ অনুমান। ইন: কম্পিউটার ভিশন এবং প্যাটার্ন রিকগনিশন (সিভিপিআর) বিষয়ে IEEE সম্মেলন (জুন 2018)
আয়ুষ, কে., জান্দিয়াল, এস., চোপড়া, এ., কৃষ্ণমূর্তি, বি.: সহায়ক মানব বিভাজন শিক্ষার মাধ্যমে ভার্চুয়াল ট্রাই-অনকে শক্তিশালী করা। এতে: IEEE ইন্টারন্যাশনাল কনফারেন্স অন কম্পিউটার ভিশন (ICCV) কর্মশালা (অক্টোবর 2019)
Belongie, S., Malik, J., Puzicha, J.: আকৃতির প্রসঙ্গ ব্যবহার করে আকৃতি মেলানো এবং বস্তুর স্বীকৃতি। পামি (2002)
Bogo, F., Kanazawa, A., Lassner, C., Gehler, P., Romero, J., Black, MJ: Keep it SMPL: একটি একক চিত্র থেকে 3D মানুষের ভঙ্গি এবং আকৃতির স্বয়ংক্রিয় অনুমান। ইন: ECCV (2016)
Brock, A., Donahue, J., Simonyan, K.: উচ্চ বিশ্বস্ততা প্রাকৃতিক ইমেজ সংশ্লেষণের জন্য বড় স্কেল গ্যান প্রশিক্ষণ। arXiv প্রিপ্রিন্ট arXiv:1809.11096 (2018)
Chen, LC, Zhu, Y., Papandreou, G., Schroff, F., Adam, H.: শব্দার্থিক ইমেজ বিভাজনের জন্য atrous separable convolution সহ এনকোডার-ডিকোডার। ইন: ECCV (2018)
চেন, এম., কিন, ওয়াই., কিউই, এল., সান, ওয়াই.: দ্বৈত মনোযোগ বৈশিষ্ট্য বর্ধনের মাধ্যমে ফ্যাশন ল্যান্ডমার্ক সনাক্তকরণের উন্নতি। এতে: ICCV কর্মশালা (2019)
চেন, ডব্লিউ., ওয়াং, এইচ., লি, ওয়াই., সু, এইচ., ওয়াং, জেড., তু, সি., লিসচিনস্কি, ডি., কোহেন-অর, ডি., চেন, বি.: প্রশিক্ষণের ছবি সংশ্লেষণ করা মানুষের 3D পোজ অনুমান বাড়ানোর জন্য (2015)
চং, এমজে, ফোরসিথ, ডি.: কার্যকরভাবে নিরপেক্ষ ফিড এবং ইনসেপশন স্কোর এবং কোথায় সেগুলি খুঁজে পাবেন। arXiv প্রিপ্রিন্ট arXiv:1911.07023 (2019)
Danerek, R., Dibra, E., Oztireli, AC, Ziegler, R., Gross, MH: ডিপগার্মেন্ট : একটি একক চিত্র থেকে 3d পোশাকের আকৃতির অনুমান। কম্পিউট চিত্রলেখ. ফোরাম (2017)
ডং, এইচ., লিয়াং, এক্স., গং, কে., লাই, এইচ., ঝু, জে., ইয়িন, জে.: পোজ-নির্দেশিত ব্যক্তি ইমেজ সংশ্লেষণের জন্য নরম-গেটেড ওয়ার্পিং-গান। ইন: নিউরিআইপিএস (2018)
ডং, এইচ., লিয়াং, এক্স., ওয়াং, বি., লাই, এইচ., ঝু, জে., ইয়িন, জে.: মাল্টি-পোজ গাইডেড ভার্চুয়াল ট্রাই-অন নেটওয়ার্কের দিকে৷ ইন: ICCV (2019)
Grigor'ev, AK, Sevastopolsky, A., Vakhitov, A., Lempitsky, VS: Coordinatebased texture in painting for pose-directed human image production. CVPR (2019)
গুয়ান, পি., রেইস, এল., হির্শবার্গ, ডি., ওয়েইস, এ., ব্ল্যাক, এম.: ড্রেপ: যে কোনো ব্যক্তিকে সাজানো। গ্রাফিক্সের উপর ACM লেনদেন - TOG (2012)
হান, এক্স., হু, এক্স., হুয়াং, ডব্লিউ., স্কট, এমআর: ক্লথফ্লো: পোশাক পরা ব্যক্তি প্রজন্মের জন্য একটি প্রবাহ-ভিত্তিক মডেল। ইন: ICCV (2019)
হান, এক্স., উ, জেড., হুয়াং, ডব্লিউ., স্কট, এমআর, ডেভিস, এলএস: সামঞ্জস্যপূর্ণ এবং বৈচিত্র্যময় ফ্যাশন ইমেজ ইনপেইন্টিং (2019)
Han, X., Wu, Z., Wu, Z., Yu, R., Davis, LS: Viton: একটি ইমেজ-ভিত্তিক ভার্চুয়াল ট্রাই-অন নেটওয়ার্ক। ইন: CVPR (2018)
Heusel, M., Ramsauer, H., Unterthiner, T., Nessler, B., Hochreiter, S.: একটি দুই টাইম-স্কেল আপডেট রুল দ্বারা প্রশিক্ষিত গ্যান্স স্থানীয় ন্যাশ ভারসাম্যে একত্রিত হয়। ইন: নিউরাল ইনফরমেশন প্রসেসিং সিস্টেমে অগ্রগতি। পিপি 6626–6637 (2017)
Hsiao, WL, Grauman, K.: শরীরের বিভিন্ন আকারের জন্য ড্রেসিং। ArXiv (2019)
Hsiao, WL, Katsman, I., Wu, CY, Parikh, D., Grauman, K.: ফ্যাশন++: পোশাকের উন্নতির জন্য ন্যূনতম সম্পাদনা। ইন: IEEE ইন্টারন্যাশনাল কনফারেন্স অন কম্পিউটার ভিশন (ICCV) (2019) এর কার্যক্রমে
Hsieh, CW, Chen, CY, Chou, CL, Shuai, HH, Liu, J., Cheng, WH: Fashionon: বিশদ মানব এবং পোশাকের তথ্য সহ শব্দার্থ-নির্দেশিত চিত্র-ভিত্তিক ভার্চুয়াল ট্রাই-অন। ইন: MM '19 (2019)
HyugJae, Lee, R., Kang, M., Cho, M., Park, G.: La-viton: আকর্ষণীয় ভার্চুয়াল চেষ্টা করার জন্য একটি নেটওয়ার্ক। এতে: ICCV কর্মশালা (2019)
Jaderberg, M., Simonyan, K., Zisserman, A., kavukcuoglu, k.: স্থানিক ট্রান্সফরমার নেটওয়ার্ক। ইন: নিউরিআইপিএস (2015)
জান্দিয়াল, এস., চোপড়া, এ., আয়ুষ, কে., হেমানি, এম., কুমার, এ., কৃষ্ণমূর্তি, বি.: সিভেনেট: শক্তিশালী ইমেজ-ভিত্তিক ভার্চুয়াল ট্রাই-অনের জন্য একীভূত কাঠামো। ইন: WACV (2020)
Jeong, MH, Han, DH, Ko, HS: একটি ফটোগ্রাফ থেকে গার্মেন্ট ক্যাপচার। জার্নাল অফ ভিজ্যুয়ালাইজেশন এবং কম্পিউটার অ্যানিমেশন (2015)
Ji, D., Kwon, J., McFarland, M., Savarese, S.: Deep view morphing. ইন: CVPR (2017)
কানাজাওয়া, এ., ব্ল্যাক, এমজে, জ্যাকবস, ডিডব্লিউ, মালিক, জে.: মানুষের আকৃতি এবং ভঙ্গির শেষ থেকে শেষ পুনরুদ্ধার। CVPR (2018)
কানাজাওয়া, এ., জ্যাকবস, ডি., চন্দ্রকার, এম.: ওয়ার্পনেট: একক-দর্শন পুনর্গঠনের জন্য দুর্বলভাবে তত্ত্বাবধান করা ম্যাচিং। ইন: CVPR (2016)
Karras, T., Laine, S., Aila, T.: জেনারেটিভ অ্যাডভারসারিয়াল নেটওয়ার্কের জন্য একটি শৈলী-ভিত্তিক জেনারেটর আর্কিটেকচার। ইন: কম্পিউটার ভিশন এবং প্যাটার্ন রিকগনিশনের উপর IEEE সম্মেলনের কার্যপ্রণালী। পিপি 4401–4410 (2019)
Lin, CH, Yumer, E., Wang, O., Shechtman, E., Lucey, S.: St-gan: চিত্র সংমিশ্রণের জন্য স্থানিক ট্রান্সফরমার জেনারেটিভ অ্যাডভারসারিয়াল নেটওয়ার্ক। ইন: CVPR (2018)
Liu, G., Reda, FA, Shih, KJ, Wang, TC, Tao, A., Catanzaro, B.: আংশিক কনভোলিউশন ব্যবহার করে অনিয়মিত গর্তের জন্য চিত্র আঁকা। ইন: ECCV (2018)
লিউ, কেএইচ, চেন, টিওয়াই, চেন, সিএস: এমভিসি: দৃশ্য-অপরিবর্তিত পোশাক পুনরুদ্ধার এবং বৈশিষ্ট্যের পূর্বাভাসের জন্য একটি ডেটাসেট। ইন: ICMR (2016)
Liu, Z., Luo, P., Qiu, S., Wang, X., Tang, X.: ডিপফ্যাশন: শক্তিশালী পোশাকের স্বীকৃতি এবং সমৃদ্ধ টীকা দিয়ে পুনরুদ্ধার করা। ইন: CVPR (2016)
ম্যাককিনসি: স্টেট অফ দ্য ফ্যাশন ইন্ডাস্ট্রি 2019 (2019)
Natsume, R., Saito, S., Huang, Z., Chen, W., Ma, C., Li, H., Morishima, S.: Siclope: সিলুয়েট-ভিত্তিক পোশাক পরিহিত মানুষ সম্পূরক উপকরণ। ইন: CVPR (2019)
Neverova, N., Gler, RA, Kokkinos, I.: ঘন পোজ স্থানান্তর। ইন: ECCV (2018)
রাফি, এএইচ, সোল্লামি, এম.: গার্মেন্টগান: ফটো-বাস্তববাদী প্রতিপক্ষ ফ্যাশন ট্রান্সফার (2020)
Raj, A., Sangkloy, P., Chang, H., Hays, J., Ceylan, D., Lu, J.: Swapnet: চিত্র ভিত্তিক পোশাক স্থানান্তর। ইন: ECCV (2018)
Rocco, I., Arandjelovi'c, R., Sivic, J.: জ্যামিতিক মিলের জন্য কনভোল্যুশনাল নিউরাল নেটওয়ার্ক আর্কিটেকচার। ইন: CVPR (2017)
সাইতো, এস., হুয়াং, জেড., নাটসুম, আর., মরিশিমা, এস., কানাজাওয়া, এ., লি, এইচ.: পিফু: উচ্চ-রেজোলিউশন পরিহিত মানব ডিজিটাইজেশনের জন্য পিক্সেললাইনড অন্তর্নিহিত ফাংশন। ICCV (2019)
শ্রফ, এফ., ক্যালেনিচেঙ্কো, ডি., ফিলবিন, জে.: ফেসনেট: ফেস রিকগনিশন এবং ক্লাস্টারিংয়ের জন্য একটি ইউনিফাইড এমবেডিং। ইন: CVPR (2015)
গান, ডি., লি, টি., মাও, জেড., লিউ, এ.: এসপি-ভিটন: আকৃতি-সংরক্ষণকারী চিত্র-ভিত্তিক ভার্চুয়াল ট্রাই-অন নেটওয়ার্ক। মাল্টিমিডিয়া টুল এবং অ্যাপ্লিকেশন (2019)
Suzuki, S., Abe, K.: সীমানা অনুসরণ করে ডিজিটালাইজড বাইনারি ইমেজের টপোলজিক্যাল স্ট্রাকচারাল বিশ্লেষণ। কম্পিউটার ভিশন, গ্রাফিক্স এবং ইমেজ প্রসেসিং (1985)
ভ্যাকারো, কে., আগরওয়ালা, টি., শিবকুমার, এস., কুমার, আর.: ব্যক্তিগত ফ্যাশনের ভবিষ্যত ডিজাইন করা। ইন: কম্পিউটিং সিস্টেমে মানবিক উপাদানের উপর 2018 CHI সম্মেলনের কার্যক্রম (2018)
Wang, B., Zheng, H., Liang, X., Chen, Y., Lin, L.: বৈশিষ্ট্য-সংরক্ষণের ইমেজ-ভিত্তিক ভার্চুয়াল ট্রাই-অন নেটওয়ার্কের দিকে। ইন: কম্পিউটার ভিশন (ECCV) (2018) সম্পর্কিত ইউরোপীয় সম্মেলনের কার্যপ্রণালী
Wang, J., Zhang, W., Liu, WH, Mei, T.: শেষ বিশদে নিচে: বিস্তারিত খোদাই সহ ভার্চুয়াল ট্রাই-অন। ArXiv (2019)
Wu, Z., Lin, G., Tao, Q., Cai, J.: M2e-নেটে চেষ্টা করুন: মডেল থেকে সবার কাছে ফ্যাশন। ইন: MM '19 (2018)
ইয়াং, সি., লু, এক্স., লিন, জেড., শেখটম্যান, ই., ওয়াং, ও., লি, এইচ.: মাল্টি-স্কেল নিউরাল প্যাচ সংশ্লেষণ ব্যবহার করে উচ্চ-রেজোলিউশন ইমেজ পেইন্টিং। ইন: CVPR (2017)
ইউ, জে., লিন, জেড., ইয়াং, জে., শেন, এক্স., লু, এক্স., হুয়াং, টিএস: গেটেড কনভোলিউশন সহ মুক্ত-ফর্মের চিত্র। ইন: ICCV (2019)
ইউ, জে., লিন, জেডএল, ইয়াং, জে., শেন, এক্স., লু, এক্স., হুয়াং, টিএস: প্রাসঙ্গিক মনোযোগ সহ জেনারেটিভ ইমেজ পেইন্টিং। ইন: CVPR (2018)
Yu, L., Zhong, Y., Wang, X.: নির্বাচনী পোশাক স্থানান্তরের জন্য ইনপেইন্টিং-ভিত্তিক ভার্চুয়াল ট্রাই-অন নেটওয়ার্ক। IEEE অ্যাক্সেস (2019)
Yu, L., Zhong, Y., Wang, X.: নির্বাচনী পোশাক স্থানান্তরের জন্য ইনপেইন্টিং-ভিত্তিক ভার্চুয়াল ট্রাই-অন নেটওয়ার্ক। IEEE অ্যাক্সেস (2019)
Yu, R., Wang, X., Xie, X.: Vtnfp: বডি এবং পোশাক বৈশিষ্ট্য সংরক্ষণের সাথে একটি ইমেজ-ভিত্তিক ভার্চুয়াল ট্রাই-অন নেটওয়ার্ক
ঝাং, এইচ., গুডফেলো, আই., মেটাক্সাস, ডি., ওডেনা, এ.: স্ব-মনোযোগ জেনারেটিভ অ্যাডভারসারিয়াল নেটওয়ার্ক। arXiv প্রিপ্রিন্ট arXiv:1805.08318 (2018)
Zheng, N., Song, X., Chen, Z., Hu, L., Cao, D., Nie, L.: কার্যত নির্বিচারে ভঙ্গি সহ নতুন পোশাকের চেষ্টা করছেন৷ ইন: MM '19 (2019)
Zheng, S., Yang, F., Kiapour, MH, Piramuthu, R.: Modanet: বহুভুজ টীকা সহ একটি বড় মাপের স্ট্রিটফ্যাশন ডেটাসেট৷ ইন: ACM মাল্টিমিডিয়া (2018)
Zhu, S., Fidler, S., Urtasun, R., Lin, D., Chen, CL: আপনার নিজস্ব প্রডা হও: কাঠামোগত সমন্বয় সহ ফ্যাশনসিন্থেসিস। ইন: CVPR (2017)
এই কাগজটি CC BY-NC-SA 4.0 DEED লাইসেন্সের অধীনে arxiv-এ উপলব্ধ ।