本周,阿里国际联合上海人工智能实验室与北京语言大学推出AI翻译测评榜单TransBench,并在OpenCompass上线。该榜单新增幻觉率、文化禁忌词及敬语规范等指标,首次针对细分行业构建评测数据和方法。所有指标源于真实使用反馈,且测评方法已开源。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。
本周,阿里国际联合上海人工智能实验室与北京语言大学推出AI翻译测评榜单TransBench,并在OpenCompass上线。该榜单新增幻觉率、文化禁忌词及敬语规范等指标,首次针对细分行业构建评测数据和方法。所有指标源于真实使用反馈,且测评方法已开源。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。