यह पेपर CC 4.0 लाइसेंस के अंतर्गत arxiv पर उपलब्ध है।
लेखक:
(1) झिहांग रेन, कैलिफोर्निया विश्वविद्यालय, बर्कले और इन लेखकों ने इस कार्य में समान रूप से योगदान दिया (ईमेल: [email protected]);
(2) जेफरसन ऑर्टेगा, कैलिफोर्निया विश्वविद्यालय, बर्कले और इन लेखकों ने इस कार्य में समान रूप से योगदान दिया (ईमेल: [email protected]);
(3) यिफान वांग, कैलिफोर्निया विश्वविद्यालय, बर्कले और इन लेखकों ने इस कार्य में समान रूप से योगदान दिया (ईमेल: [email protected]);
(4) झिमिन चेन, कैलिफोर्निया विश्वविद्यालय, बर्कले (ईमेल: [email protected]);
(5) युनहुई गुओ, यूनिवर्सिटी ऑफ टेक्सास एट डलास (ईमेल: [email protected]);
(6) स्टेला एक्स. यू, कैलिफोर्निया विश्वविद्यालय, बर्कले और मिशिगन विश्वविद्यालय, एन आर्बर (ईमेल: [email protected]);
(7) डेविड व्हिटनी, कैलिफोर्निया विश्वविद्यालय, बर्कले (ईमेल: [email protected]).
शोधकर्ताओं के लिए सामाजिक अनुभूति को समझना आवश्यक है कि मनुष्य दूसरों की भावनाओं का अनुमान कैसे लगाते हैं। जबकि मनोभौतिकीविद प्रयोग करते हैं, उन्हें प्रयोगों को डिजाइन करने के लिए विशिष्ट उत्तेजना सेट की आवश्यकता होती है। हालाँकि, प्रकाशित डेटासेट में, वर्तमान में कोई संदर्भ-आधारित वीडियो डेटासेट नहीं है जिसमें निरंतर वैलेंस और उत्तेजना रेटिंग शामिल हो। इस तरह के डेटासेट की कमी शोधकर्ताओं को संबंधित कार्यों के लिए कंप्यूटर विज़न एल्गोरिदम विकसित करने से भी रोकती है। हमारा प्रस्तावित VEATIC डेटासेट कंप्यूटर विज़न के क्षेत्र में इस महत्वपूर्ण अंतर को भरता है और भावना पहचान को समझने में मनोभौतिकी अध्ययनों के लिए फायदेमंद होगा।
डेटा संग्रह के दौरान, प्रतिभागियों ने वीडियो क्लिप में लक्षित पात्रों की भावनाओं को लगातार ट्रैक किया और उनका मूल्यांकन किया, जो सामान्य मनोभौतिक प्रयोगों से अलग है, जहाँ प्रतिक्रियाएँ देरी के बाद एकत्र की जाती हैं। हमारे डेटासेट में यह डिज़ाइन वास्तविक समय की भावना प्रसंस्करण की नकल करने के लिए महत्वपूर्ण था जो तब होता है जब मनुष्य अपने दैनिक जीवन में भावनाओं को संसाधित करता है। इसके अतिरिक्त, भावना प्रसंस्करण एक तत्काल प्रक्रिया नहीं है और यह दूसरों की भावनाओं के बारे में सटीक अनुमान लगाने के लिए समय के साथ जानकारी के अस्थायी संचय पर बहुत अधिक निर्भर करता है।
VEATIC डेटासेट की खूबी यह है कि यह वास्तविक दुनिया में मनुष्य की भावनाओं को समझने के तरीके की नकल करता है: लगातार और समय और स्थान दोनों ही क्षेत्रों में प्रासंगिक जानकारी की मौजूदगी में। ऐसा समृद्ध डेटासेट भविष्य के कंप्यूटर विज़न मॉडल के लिए महत्वपूर्ण है और मौजूदा मॉडल की सीमाओं को आगे बढ़ा सकता है। VEATIC जैसे अधिक समृद्ध डेटासेट के निर्माण के साथ, भविष्य के कंप्यूटर विज़न मॉडल के लिए मनुष्यों के साथ बातचीत करते समय वास्तविक समय में भावनाओं को समझना संभव हो सकता है।
यह पेपर CC 4.0 लाइसेंस के अंतर्गत arxiv पर उपलब्ध है।