यह पेपर CC 4.0 लाइसेंस के अंतर्गत arxiv पर उपलब्ध है।
लेखक:
(1) झिहांग रेन, कैलिफोर्निया विश्वविद्यालय, बर्कले और इन लेखकों ने इस कार्य में समान रूप से योगदान दिया (ईमेल: peter.zhren@berkeley.edu);
(2) जेफरसन ऑर्टेगा, कैलिफोर्निया विश्वविद्यालय, बर्कले और इन लेखकों ने इस कार्य में समान रूप से योगदान दिया (ईमेल: jefferson_ortega@berkeley.edu);
(3) यिफान वांग, कैलिफोर्निया विश्वविद्यालय, बर्कले और इन लेखकों ने इस कार्य में समान रूप से योगदान दिया (ईमेल: wyf020803@berkeley.edu);
(4) झिमिन चेन, कैलिफोर्निया विश्वविद्यालय, बर्कले (ईमेल: zhimin@berkeley.edu);
(5) युनहुई गुओ, यूनिवर्सिटी ऑफ टेक्सास एट डलास (ईमेल: yunhui.guo@utdallas.edu);
(6) स्टेला एक्स. यू, कैलिफोर्निया विश्वविद्यालय, बर्कले और मिशिगन विश्वविद्यालय, एन आर्बर (ईमेल: stellayu@umich.edu);
(7) डेविड व्हिटनी, कैलिफोर्निया विश्वविद्यालय, बर्कले (ईमेल: dwhitney@berkeley.edu).
शोधकर्ताओं के लिए सामाजिक अनुभूति को समझना आवश्यक है कि मनुष्य दूसरों की भावनाओं का अनुमान कैसे लगाते हैं। जबकि मनोभौतिकीविद प्रयोग करते हैं, उन्हें प्रयोगों को डिजाइन करने के लिए विशिष्ट उत्तेजना सेट की आवश्यकता होती है। हालाँकि, प्रकाशित डेटासेट में, वर्तमान में कोई संदर्भ-आधारित वीडियो डेटासेट नहीं है जिसमें निरंतर वैलेंस और उत्तेजना रेटिंग शामिल हो। इस तरह के डेटासेट की कमी शोधकर्ताओं को संबंधित कार्यों के लिए कंप्यूटर विज़न एल्गोरिदम विकसित करने से भी रोकती है। हमारा प्रस्तावित VEATIC डेटासेट कंप्यूटर विज़न के क्षेत्र में इस महत्वपूर्ण अंतर को भरता है और भावना पहचान को समझने में मनोभौतिकी अध्ययनों के लिए फायदेमंद होगा।
डेटा संग्रह के दौरान, प्रतिभागियों ने वीडियो क्लिप में लक्षित पात्रों की भावनाओं को लगातार ट्रैक किया और उनका मूल्यांकन किया, जो सामान्य मनोभौतिक प्रयोगों से अलग है, जहाँ प्रतिक्रियाएँ देरी के बाद एकत्र की जाती हैं। हमारे डेटासेट में यह डिज़ाइन वास्तविक समय की भावना प्रसंस्करण की नकल करने के लिए महत्वपूर्ण था जो तब होता है जब मनुष्य अपने दैनिक जीवन में भावनाओं को संसाधित करता है। इसके अतिरिक्त, भावना प्रसंस्करण एक तत्काल प्रक्रिया नहीं है और यह दूसरों की भावनाओं के बारे में सटीक अनुमान लगाने के लिए समय के साथ जानकारी के अस्थायी संचय पर बहुत अधिक निर्भर करता है।
VEATIC डेटासेट की खूबी यह है कि यह वास्तविक दुनिया में मनुष्य की भावनाओं को समझने के तरीके की नकल करता है: लगातार और समय और स्थान दोनों ही क्षेत्रों में प्रासंगिक जानकारी की मौजूदगी में। ऐसा समृद्ध डेटासेट भविष्य के कंप्यूटर विज़न मॉडल के लिए महत्वपूर्ण है और मौजूदा मॉडल की सीमाओं को आगे बढ़ा सकता है। VEATIC जैसे अधिक समृद्ध डेटासेट के निर्माण के साथ, भविष्य के कंप्यूटर विज़न मॉडल के लिए मनुष्यों के साथ बातचीत करते समय वास्तविक समय में भावनाओं को समझना संभव हो सकता है।
यह पेपर CC 4.0 लाइसेंस के अंतर्गत arxiv पर उपलब्ध है।