AI读钟难题:视觉推理能力仍远逊人类

一项新研究显示,人类读取指针式时钟的准确率高达89.1%,而当前最优AI模型的准确率仅为13.3%,凸显AI在视觉推理方面与人类存在显著差距。该结果来自由阿莱克・萨法尔设计的“ClockBench”测试,涵盖180个定制时钟及720道相关题目,旨在评估AI模型对钟面信息的解读能力。

测试表明,AI在读取罗马数字、镜像布局或彩色背景等复杂钟面时表现尤差,准确率最低降至3.2%。相比之下,人类中位误差仅3分钟,AI最佳模型误差也达1小时。研究指出,AI的瓶颈在于视觉信息转化,而非后续计算能力。尽管顶尖模型表现优于随机猜测,但要突破当前限制,可能需要全新技术路径。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1