Cet article est disponible sur arxiv sous licence CC 4.0.
Auteurs:
(1) Zhihang Ren, Université de Californie, Berkeley et ces auteurs ont contribué à parts égales à ce travail (E-mail : peter.zhren@berkeley.edu) ;
(2) Jefferson Ortega, Université de Californie, Berkeley et ces auteurs ont contribué à parts égales à ce travail (E-mail : jefferson_ortega@berkeley.edu) ;
(3) Yifan Wang, Université de Californie, Berkeley et ces auteurs ont contribué à parts égales à ce travail (E-mail : wyf020803@berkeley.edu) ;
(4) Zhimin Chen, Université de Californie, Berkeley (E-mail : zhimin@berkeley.edu) ;
(5) Yunhui Guo, Université du Texas à Dallas (E-mail : yunhui.guo@utdallas.edu) ;
(6) Stella X. Yu, Université de Californie, Berkeley et Université du Michigan, Ann Arbor (E-mail : stellayu@umich.edu) ;
(7) David Whitney, Université de Californie, Berkeley (E-mail : dwhitney@berkeley.edu).
Comprendre comment les humains déduisent les émotions des autres est essentiel pour que les chercheurs comprennent la cognition sociale. Tandis que les psychophysiciens mènent des expériences, ils ont besoin d’ensembles de stimuli spécifiques pour concevoir leurs expériences. Cependant, parmi les ensembles de données publiés, il n'existe actuellement aucun ensemble de données vidéo contextuelles contenant des évaluations continues de la valence et de l'éveil. L’absence de ce type d’ensembles de données empêche également les chercheurs de développer des algorithmes de vision par ordinateur pour les tâches correspondantes. Notre ensemble de données VEATIC proposé comble cette lacune importante dans le domaine de la vision par ordinateur et sera bénéfique pour les études psychophysiques visant à comprendre la reconnaissance des émotions. D
Au cours de la collecte de données, les participants ont suivi et évalué en permanence les émotions des personnages cibles dans les clips vidéo, ce qui est différent des expériences psychophysiques générales où les réponses sont collectées après un délai. Cette conception de notre ensemble de données était essentielle pour imiter le traitement des émotions en temps réel qui se produit lorsque les humains traitent leurs émotions dans leur vie quotidienne. De plus, le traitement des émotions n’est pas un processus immédiat et repose en grande partie sur l’accumulation temporelle d’informations au fil du temps afin de tirer des conclusions précises sur les émotions des autres.
La force de l’ensemble de données VEATIC est qu’il imite la façon dont les humains perçoivent les émotions dans le monde réel : en continu et en présence d’informations contextuelles à la fois dans le domaine temporel et spatial. Un ensemble de données aussi riche est vital pour les futurs modèles de vision par ordinateur et peut repousser les limites de ce que les modèles actuels peuvent accomplir. Avec la création d’ensembles de données plus riches comme VEATIC, il pourrait être possible pour les futurs modèles de vision par ordinateur de percevoir les émotions en temps réel lors de l’interaction avec les humains.
Cet article est disponible sur arxiv sous licence CC 4.0.