上海AI实验室发布全球首个视频转网页评测基准IWR-Bench

上海人工智能实验室联合浙江大学推出全球首个视频转网页评测基准IWR-Bench,填补AI前端开发领域在动态交互能力评估方面的空白。

该评测基准要求AI模型基于输入的视频和静态资源重建可交互网页,覆盖2048游戏、机票预订等多场景任务,通过视觉保真度(VFS)与交互功能正确性(IFS)两大指标进行量化评估。其采用匿名化静态资源和自动化测试流程,设计上贴近实际前端开发环境。

针对28款主流AI模型的测试结果显示,GPT-5综合得分为36.35分,其中VFS为64.25%,IFS仅为24.39%,反映出当前模型在实现完整交互功能方面存在显著短板。专门优化视频理解的模型表现未达预期,引入“思考”机制对性能提升有限。IWR-Bench的发布旨在推动AI在前端工程化应用中的技术融合与迭代,未来有望降低网页开发门槛。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1