AI评测新工具上线,用户可为500余款大模型打分

AI初创公司Yupp推出了一项“人工评测系统”,邀请用户为ChatGPT、Claude、Gemini等超过500款大语言模型评分。通过收集用户反馈,Yupp将构建名为Yupp AI VIBE的排行榜,直观展示各模型性能差异。该平台由前X员工Pankaj Gupta与Gilad Mishne创立,旨在让用户低成本体验各大AI模型的同时,为其提供评价机会,助力AI公司优化模型。

新注册用户初始拥有5000积分,可在平台上提问,随机或指定两个模型作答,并对比优劣。完成反馈后,用户可获额外积分以调用更多模型。平台支持最多6个模型同时回复,但对不提供反馈的用户将限制使用权限。此举为AI行业提供了宝贵的用户视角数据参考。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1