快讯
PS+会免游戏:《古墓丽影:崛起》图文攻略汇总
2020-07-10 16:55:00
PS+会免游戏:《古墓丽影:崛起》图文攻略汇总
2020-07-10 16:55:00
PS5游戏封面首度公开《漫威蜘蛛侠迈尔斯莫拉里斯》封面发表
5小时前
索尼投资2.5亿美元收购EpicGames少量股权将加深双方合作
5小时前
官方回顾过去十年被取消的V社游戏《半条命3》《求生之路3》等
6小时前
恐怖冒险游戏《修道院破碎瓷器》宣布延期至10月20日发售
7小时前
国产西部武侠ARPG《紫塞秋风》上市首周售价88元
9小时前
Epic喜加三:《杀戮空间2》《逃脱者2》《荒芜星球》免费提供
9小时前
《纸片马力欧折纸国王》十分钟实机演示战斗、升级、Boss战
10小时前
NCH《怪物猎人》魔性动画“煌黑龙”欺负古龙的带恶人
10小时前
《妖精的尾巴魔导少年》中文角色系统介绍可触发原创剧情
10小时前
买车变租车,3000人网络维权,弹个车还能活多久?
10小时前
同性交友第一股,居然是中国人的
10小时前
舒适的大块头国产飞行家正式上市售50.98-75.98万元
11小时前
《集合啦!动物森友会》图文攻略汇总
14小时前
看点满满,第四届微博杯今日清凉来袭
15小时前
FAMI通发布2020年上半年日本家用游戏市场软硬件销量速报
15小时前
《伊苏:起源》将于2020年秋季登陆NS平台
15小时前
传闻《EldenRing》将在Xbox发布会上发布预告
15小时前
《伊苏:起源》Switch版今秋推出支持简繁中文语言
15小时前
《狼人之末日怒吼:地灵之血》新实机宣传片公开
16小时前
卡普空发《生化危机8》问卷近期或推出试玩版
16小时前
《刀剑神域:彼岸游境》提升友好度的方法
16小时前
《Sky光遇》突破2000万下载量将办周年祭
16小时前
《WWE2K竞技场》公布最新宣传片感受无限制缠斗
16小时前
PC版《死亡搁浅》发售日延后开发方需更多时间
16小时前
《刀剑神域:彼岸游境》繁体中文版上市宣传片公布
16小时前
《死亡搁浅》PC版预购宣传片以及预购奖励公布
16小时前
《死亡搁浅》PC版初体验:画面升级优化到位
16小时前
卡牌游戏《卡纳洛克:神战》将推出中国神话免费DLC
16小时前

今日头条升级灵犬反低俗助手,新增图片识别功能

2019-07-30 18:07:11 费倩文

DoNews7月30日消息 (记者 费倩文)7月30日,今日头条宣布正式推出新版灵犬反低俗助手(以下简称“灵犬”),同时支持图片和文本识别,据字节跳动人工智能实验室总监王长虎透露,“灵犬”后续还将支持语音识别和视频识别。

无标题.png

用户目前可以在今日头条内,搜索“灵犬”进行试用,只需要在“灵犬”内输入一段文字或文章链接,“灵犬”就可以帮助其检测内容健康指数,返回一个鉴定结果。对于用户输入的内容,“灵犬”会先进行提取、分词和语义识别,然后根据相关规则,输出对应的分数、评级和结论。这一切都在短短几秒内完成。图片和图片链接检测同理,用户在“灵犬”内上传图片或图片链接,即可快速获取鉴定结果。截至2019年6月,灵犬反低俗助手的使用人次已经超过了300万。

据悉,“灵犬”脱胎于今日头条反低俗模型,是一款检测内容健康度的辅助小工具,致力于打击低俗低质内容,自2012年以来今日头条内部搭建了反色情、反低俗、反标题党、反虚假信息、反低质等数百个模型,并投入近万人专业审核团队。

此前一年时间内,“灵犬”已陆续完成两次迭代。2018年3月28日,今日头条首次上线“灵犬”,支持检测文字和文章链接。2018年5月16日,“灵犬”完成服务能力升级,增加反色情短文本模型和反谩骂模型,将准确率从73%提升至82%。2019年2月20日,“灵犬2.0”正式上线,除了反色情低俗模型,加入反暴力谩骂和反标题党模型,覆盖了主要的低俗低质内容类型,整体识别准确率接近85%。

这是时隔半年后,“灵犬”的又一次重要升级。据王长虎介绍,新版“灵犬”重点拓展了反低俗识别类型和模型能力,现已覆盖图片识别(反色情低俗、反血腥暴力)和文本识别(反色情低俗、反暴力谩骂、反标题党),后续还将支持语音识别和视频识别。

据王长虎介绍,在文本识别层面,“灵犬”已经经过了三次迭代,每个新版本相对于旧版本,在技术和数据集层面,都有一个明显的跃升,这一代“灵犬”同时应用了“Bert”和半监督技术,训练数据集总量是1.2个T,相当于20倍百度百科或100倍维基百科的数据总量,包含920万个样本,准确率提升至91%。

在图片识别层面,“灵犬”采用深度学习作为解决方案,在数据、模型、计算力等方面均做了针对性优化。数据层面,“灵犬”已累积上千万级别的训练数据。

在模型层面,“灵犬”针对许多困难样本做了模型结构调优,尝试解决多尺寸、多尺度、小目标等复杂问题。计算力层面,“灵犬”利用分布式训练算法以及GPU训练集群,加速模型的训练和调试。

王长虎表示,针对低俗判断问题的复杂性和不同判断方式的局限性,一方面需要不断进化技术模型,一方面需要有效结合技术和人工判断两种方式。当前,“灵犬”建设了比较完善的模型迭代系统。通过“数据收集—数据标注—数据清洗—模型训练—模型评估—badcase分析”这一套完整的流程,持续做优化。(完)

相关文章

{{news.title}}

{{news.timeFormat}} {{news.author}}

正在加载......