Bu makale arxiv'de CC 4.0 lisansı altında mevcuttur.
Yazarlar:
(1) Zhihang Ren, Kaliforniya Üniversitesi, Berkeley ve bu yazarlar bu çalışmaya eşit katkıda bulunmuşlardır (E-posta: peter.zhren@berkeley.edu);
(2) Jefferson Ortega, California Üniversitesi, Berkeley ve bu yazarlar bu çalışmaya eşit katkıda bulunmuşlardır (E-posta: jefferson_ortega@berkeley.edu);
(3) Yifan Wang, California Üniversitesi, Berkeley ve bu yazarlar bu çalışmaya eşit katkıda bulunmuşlardır (E-posta: wyf020803@berkeley.edu);
(4) Zhimin Chen, Kaliforniya Üniversitesi, Berkeley (E-posta: zhimin@berkeley.edu);
(5) Yunhui Guo, Dallas'taki Texas Üniversitesi (E-posta: yunhui.guo@utdallas.edu);
(6) Stella X. Yu, Kaliforniya Üniversitesi, Berkeley ve Michigan Üniversitesi, Ann Arbor (E-posta: stellayu@umich.edu);
(7) David Whitney, Kaliforniya Üniversitesi, Berkeley (E-posta: dwhitney@berkeley.edu).
İnsanların başkalarının duygularını nasıl anladığını anlamak, araştırmacıların sosyal bilişi anlamaları için çok önemlidir. Psikofizikçiler deneyler yaparken deney tasarlamak için özel uyaran setlerine ihtiyaç duyarlar. Ancak yayınlanan veri kümeleri arasında sürekli değerlik ve uyarılma derecelendirmelerini içeren bağlam tabanlı bir video veri kümesi şu anda bulunmamaktadır. Bu tür veri kümelerinin eksikliği, araştırmacıların ilgili görevler için bilgisayarlı görme algoritmaları geliştirmesini de engelliyor. Önerilen VEATIC veri setimiz bilgisayarlı görme alanındaki bu önemli boşluğu dolduracak ve duygu tanımayı anlamada psikofiziksel çalışmalara faydalı olacaktır. D
Veri toplama sırasında katılımcılar, yanıtların bir gecikmeden sonra toplandığı genel psikofizik deneylerden farklı olarak, video kliplerdeki hedef karakterlerin duygularını sürekli olarak izleyip derecelendirdiler. Veri setimizdeki bu tasarım, insanların günlük yaşamlarında duyguları işlediğinde ortaya çıkan gerçek zamanlı duygu işlemeyi taklit etmek açısından hayati önem taşıyordu. Ek olarak, duygu işleme anlık bir süreç değildir ve başkalarının duyguları hakkında doğru çıkarımlarda bulunmak için büyük ölçüde zaman içindeki zamansal bilgi birikimine dayanır.
VEATIC veri setinin gücü, insanların gerçek dünyadaki duyguları nasıl algıladığını taklit etmesidir: sürekli olarak ve hem zamansal hem de mekansal alanda bağlamsal bilgilerin varlığında. Böylesine zengin bir veri kümesi, gelecekteki bilgisayarlı görme modelleri için hayati öneme sahiptir ve mevcut modellerin başarabileceklerinin sınırlarını zorlayabilir. VEATIC gibi daha zengin veri setlerinin oluşturulmasıyla gelecekteki bilgisayarlı görme modellerinin insanlarla etkileşim halindeyken duyguları gerçek zamanlı olarak algılaması mümkün olabilir.
Bu makale arxiv'de CC 4.0 lisansı altında mevcuttur .