芬兰图尔库大学的一项研究表明,GPT-4V能够从图像和视频中识别并解读人与人之间的复杂社交信息,其准确性几乎可与人类相媲美。
相关研究成果于9月2日发表在国际学术期刊《成像神经科学》上。研究人员在图尔库PET中心测试了ChatGPT对社交互动的评估能力,要求模型对138项不同的社交特征进行判断,包括面部表情、身体动作以及互动特性。
研究团队将AI的评估结果与超过2000名人类参与者的评估进行对比。结果显示,ChatGPT的判断与人类结果高度接近,其一致性甚至高于单个人的评估。图尔库大学博士后研究员塞韦里・桑塔维尔塔表示,ChatGPT的评估平均上比单个参与者更为一致,因此其结果甚至比个人判断更值得信赖,但多人共同的评估仍然比人工智能更准确。
在研究的第二阶段,科研团队基于AI和人类参与者作出的社交情境评估结果,利用功能性脑成像技术模拟社交感知的脑网络。结果显示,两者得出的脑网络图谱惊人地相似。
研究人员指出,收集人类的评估结果需要2000多名参与者,共耗时逾1万小时,而ChatGPT仅在数小时内完成相同工作量的评估,凸显AI在科研效率上的巨大优势。
尽管研究主要关注神经科学中的应用,但AI的社交情境自动评估功能在多个领域具有潜在价值。例如,医疗场景中可辅助医生和护士监测患者状态;在市场营销中可预测视听内容的受众反馈;在安防领域可帮助识别监控视频中的异常情况。
桑塔维尔塔补充称,人工智能不像人类一样会疲劳,能够全天候监测。未来对复杂情境的观察可能可交由AI处理,而人类则专注于确认其中最重要的发现。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。