快讯
踏浪点神:12.13黄金窄幅震荡,今日后市行情解析
3分钟前
九肆点金:炒黄金市场史诗级般的大革新,你的不理解我都懂!
6分钟前
英雄联盟:窒息型解说直播断气?LPL解说昊凯手持氧气瓶开启直播
17分钟前
她是郭台铭忠实门徒,富士康首批打工妹,自立门户后身家上百亿
18分钟前
连接香港创作者与垂直用户优酷“让港剧没有难做的生意”
19分钟前
「重磅」龙江检察教育人齐聚七台河 利用小微课推动龙江检察教育大发展
19分钟前
上市定档12月18日,主打2.0T动力,起售或低于20万!全新天籁来啦
20分钟前
《饥荒》哈姆雷特考古学家生存难度评测
20分钟前
英雄联盟LPL解说昊凯也来直播了?窒息型解说手持氧气瓶直播解说
20分钟前
Twitch游戏观看时长榜:堡垒之夜连夺五周榜首 吃鸡排名惨不忍睹
21分钟前
长沙县金井中学:46名学生改编《父亲》献礼乡村教师
21分钟前
2.0T+9AT新款迈锐宝XL12月24日上市
23分钟前
一加手机推出迈凯伦联名款?汽车领域跨界联名还能这样玩
23分钟前
东三省集体沦陷,养猪人的春天在哪里?
24分钟前
欧盟发起Joysteer 3.0转向方案 利用线控驱动技术服务残障人士
24分钟前
英雄联盟:TL教练“控诉”大师兄Doublelift不务正业还带坏新队友
24分钟前
轴距加长94mm上汽大众全新Polo申报图
25分钟前
老板说表扬就是激励,不给加薪,老员工说了个故事,老板脸都青了
25分钟前
腾讯2018员工大会:马化腾、张小龙等腾讯高管谈战略
25分钟前
苹果计划明年春推出Texture新闻收费应用
25分钟前
皇庭国际:文创情怀品牌 或将成为新零售业的全新开拓方向
25分钟前
拥抱更美好数字生活 华为DigiX数字生活节即将登陆深圳
25分钟前
强风控稳发展 和信贷位居第三方测评榜单前列
25分钟前
看好行业未来!和信贷等五家中概互金公司壕置19亿回购
25分钟前
沃尔玛新一代门店亮相成都 引领全渠道零售发展方向
25分钟前
原奥迪自动驾驶高级副总裁加入宝马 2019年1月上任
25分钟前
皮尔·彭龙任职LazadaCEO 彭蕾继续担任Lazada董事长
25分钟前
英雄联盟:S04官宣——原Splyce上单Odoamne加入
26分钟前

腾讯医疗AI实验室:3篇论文被国际顶尖会议收录 ——腾讯医疗知识图谱研究近况分享

推荐 2018-07-02 18:19:11

近日,腾讯在医疗AI领域的学术研究获得实质性进展,旗下医疗AI实验室共有3篇论文分别被KDD 2018、SIGIR 2018 、COLING 2018三个国际顶尖学术会议收录,论文的主要研究方向为医疗知识图谱中实体关系的发现和应用。

在医疗领域,专业知识和病人信息均存储在复杂多样的文本中,如医疗文献、临床病例等。文本数据中的多重表达形式和噪声给基于文本数据的AI医疗服务带来挑战和困难。知识图谱能够以结构化的形式存储医学中实体以及实体间的关系,能将信息表达成更容易被计算机处理的形式。腾讯医疗AI实验室利用知识图谱及其相关技术,如自然语言处理、知识抽取、信息检索、知识表示与推理等,从医疗文献、医学指南和临床病历中挖掘隐含的医学知识,将大数据转化为知识图谱,使得知识查询和更重要的形式化推理变得可行,有医学依据,辅助临床决策,赋能基于人工智能的医疗产品。

此次腾讯医疗AI实验室研究成果入选的三大学术会议分别是:SIGKDD,数据挖掘研究领域的顶级国际会议;SIGIR, 信息检索领域的顶级国际会议;COLING,自然语言处理领域的重要国际会议。

腾讯医疗AI实验室负责人范伟介绍,“医疗知识图谱是推动人工智能应用于医疗领域的核心驱动力之一,如何更好地利用自然语言处理、知识抽取等相关技术,从形式多样、信息杂乱的各种医疗数据中,抽取结构化的医疗知识,结构化存储实体的详细属性以及实体之间的关系,我们在不断优化提出问题并尝试给出新的解决思路和研究方法。”

以下为收录的三篇论文概要:

1. 入选KDD 2018:基于生成模型的医疗实体关系抽取(On the Generative Discovery of Structured Medical Knowledge)

研究成果:创造性地从生成模型的角度研究医疗实体关系,减少了对语料数据和专家标注的需求

在医疗知识图谱中,实体三元组以结构化的形式描述了医学领域中实体间的各种关系。为了获得医疗领域实体三元组,现有方法大多需要搜集大量语料,或过多依赖于专家的标注。如图1所示,本文提出的算法 CRVAE (Conditional Relationship Variational Autoencoder)利用已标注的实体三元组在自然语言表述上的共性和差异,对多种医疗实体关系类内的数据分布进行联合编码,进而从生成模型的角度去发现未被标注的关系实体三元组。该方法减轻了传统判别模型对于外部资源的过度依赖,并且不依赖于医疗实体关系类间的差异进行建模。

实验表明,算法CRVAE不仅能够在外部资源有限的条件下,以92.91%的支持度生成属于某个特定医疗关系的实体三元组,其生成的结果拥有77.17%的准确率且生成结果中有61.93%的样本未曾出现在训练数据中。

在未来,我们将尝试利用生成模型进行不同粒度、不同医疗子领域的无监督知识发现。同时,我们也期待将生成模型作为一种有效的数据增强方式,赋予医疗领域更多人工智能的应用。

图1  CRVAE模型架构图示

2. 入选SIGIR 2018:具有知识感知能力的答案排序模型(Knowledge-aware Attentive Neural Network for Ranking Question Answer Pairs)

研究成果:证明了利用知识图谱可显著提高问答系统的性能

在基于人工智能的医疗产品中,对话系统作为最终呈现形式有着广泛的应用。答案排序是对话系统中的重要部分,最近受到越来越多的关注。然而,已有相关工作在除关注上下文之外,对起着重要作用的背景知识却关注很少。对此,本文提出了KABLSTM(Knowledge-aware Attentive Bidirectional Long Short-Term Memory),这是一种具有知识感知能力的双向长短记忆模型,它利用知识图谱引入的背景知识来丰富问答的表征学习。

如图2所示,本文开发了一个知识交互式学习架构,其核心是一个上下文引导的注意力神经网络,可将知识图谱中的背景知识嵌入整合到句子表示中;最后结合知识型注意力机制模块,对问题和答案中的各个部分进行有效的相互关联。在WikiQA 和TREC QA 数据集上的实验结果证明了该方法具有一定有效性。在此工作中,利用知识图谱来辅助问题和答案的表示学习。在后续的工作中,我们将研究利用知识图谱进行直接推理,来帮助医疗问答系统。

图2  KABLSTM模型架构图示

3. 入选COLING 2018:基于远程监督具有协同消噪能力的实体关系抽取模型(Cooperative Denoising for Distantly Supervised Relation Extraction)

研究成果:创造性地提出能够减少数据噪声对实体关系抽取性能影响的方法

在知识图谱的构建过程中,远程监督(Distant Supervision)能够减少对标注数据的需求,因此适合从非结构化文本中进行关系抽取。然而,该方法有可能受到训练数据噪音过大的影响,性能受到限制。为解决这个问题,本文提出了一种协同消噪的模型CORD (COopeRative Denoising framework),该方法由两个神经网络和一个协同模块组成,如图 3 所示,两个神经网络分别在文本语料库和知识图谱领域进行学习,再通过一个自适应的双向蒸馏模块(adaptive bi-directional knowledge distillation)完成它们间的相互学习,达到消除噪声的目的。实验表明,该方法在噪声较大的数据上有较明显的效果提升。

在医疗领域,医疗文本、医疗影像等不同模态、不同来源的数据包含着互补的丰富信息。在后续研究工作中,我们将利用多模态、多源数据进行更加可靠的去噪和医疗知识提取。

图3  CORD模型架构图示

医疗知识图谱作为人工智能应用于医疗领域的前沿课题,对推动“AI+医疗”的发展有着重要意义,将为医疗行业的发展带来新的契机。当前,腾讯在“AI+医疗”领域的学术研究在稳步前进并获得国际学术界的认可,有利于更好的推动“AI+医疗”产学研结合,加速医疗AI应用落地,为医疗赋予AI动能。

腾讯医疗AI实验室是腾讯医疗专为医疗领域打造的人工智能实验室,采用美国-中国双中心模式,目前在硅谷、北京、深圳设立了三个分支。主要研究方向包括:通过研发临床辅助决策支持系统向各级医务工作者提供服务,以提高医生用户在医学科研、患者诊疗、疾病防控等方面的工作效率;通过研发基于无可穿戴传感器纯视频分析技术的运动障碍性疾病评测系统,可用于帕金森病的日常评测、脑瘫患者术前步态评测等方面,实现自助评测,以提高医生工作效率,减低患者评测成本;通过研发医学知识引擎,构建权威全面的医学知识库,并提供对外知识库查询等平台化服务,降低医疗人工智能辅助决策类产品的技术门槛,通过知识共享的方式与合作伙伴共同打造医疗AI的技术和服务生态圈。实验室的目标是通过世界领先的AI技术,构建良好的技术生态,服务于医患双方,提高工作效率、优化就医体验,缓解医疗资源分布不均等问题,同时着重落实分级诊疗国策。


相关文章

{{news.title}}

{{news.author}} {{news.timeFormat}}

正在加载......