阿里国际联合上海人工智能实验室与北京语言大学共同推出首个应用型AI翻译测评榜单TransBench,现已在OpenCompass上线。
TransBench区别于传统翻译测评体系,新增幻觉率、文化禁忌词及敬语规范等指标,首次针对行业细分领域构建评测数据与方法。
该榜单涵盖三大测试标准,分别为全面的通用标准、行业垂直标准和跨文化特性标准。目前,TransBench已开源其测评方法,并发布了首期测评结果。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。
阿里国际联合上海人工智能实验室与北京语言大学共同推出首个应用型AI翻译测评榜单TransBench,现已在OpenCompass上线。
TransBench区别于传统翻译测评体系,新增幻觉率、文化禁忌词及敬语规范等指标,首次针对行业细分领域构建评测数据与方法。
该榜单涵盖三大测试标准,分别为全面的通用标准、行业垂直标准和跨文化特性标准。目前,TransBench已开源其测评方法,并发布了首期测评结果。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。