中国科学院自动化研究所   设为首页   加入收藏  联系我们
 
English
网站首页     实验室概况     研究队伍     组织机构     学术交流     科研成果     人才培养     开放课题     创新文化     资源共享     联系我们
    新闻动态

【自然语言处理团队】“大规模开放域文本知识获取与应用平台”获北京市科技进步一等奖

2020年9月10日,北京市2019年度科学技术奖励大会在北京会议中心召开。其中,我所自然语言处理研究组与云知声智能科技股份有限公司合作完成的项目 “大规模开放域文本知识获取与应用平台”获得科技进步一等奖。完成人:赵军、刘康、刘升平、何世柱、陈玉博、张元哲等。

本项目成果以构建大规模知识图谱与知识应用引擎并赋能行业智能应用为总体目标,针对大数据环境下知识类型开放、语言表达多样等特点,率先提出基于弱监督卷积神经网络的大规模文本知识获取系列方法,实现了千万级规模的多领域知识自动抽取;在此基础上,创新性地提出面向异构海量知识图谱的深度学习问答方法,为知识查询和推理等深层应用提供有效技术支撑。项目的主要创新点包括:

一、针对知识获取过程中多样化文本的语义表示问题,提出基于卷积深层神经网络的知识抽取方法,有效避免了抽取模型对自然语言处理工具的过分依赖以及误差累积问题,突破了领域和语言的约束和限制,显著拓展了知识抽取的应用范围。

二、针对大规模知识获取时的训练数据不足问题,提出基于远距离监督卷积深度神经网络的知识抽取方法,有效解决了开放域环境下训练语料自动生成以及带噪数据学习问题,为大规模知识图谱构建提供了一种实际可行的解决方案。

三、针对大规模知识图谱应用中的知识匹配困难与知识稀疏问题,提出基于深度学习的端到端知识库问答与推理方法,将传统基于符号表示的问答、推理过程转变成基于语义数值计算的可学习问题,实现了大规模、开放域环境下的知识图谱有效利用。

四、基于项目主要科研成果,研发了具有完全自主知识产权的大规模知识图谱构建与应用的工具和平台,具备领域知识建模、实体识别、关系抽取、事件抽取、知识问答等核心功能。项目成果在智慧医疗、智能家居、智慧车载、智能教育等领域实现产业化应用,扩宽了人工智能的应用场景。其中,智能防疫外呼机器人在北京、上海等全国十余个城市的基层社区免费上线,日呼出量超过36000通,助力新冠肺炎疫情防控。

这是北京市科学技术奖首次分设自然科学奖、技术发明奖、科学技术进步奖。2019年度共有154项成果获奖,包括自然科学奖15项,其中一等奖5项,二等奖10项;技术发明奖12项,其中一等奖6项,二等奖6项;科学技术进步奖127项,其中特等奖1项,一等奖33项,二等奖93项。

图1、获奖证书

图2: 获奖项目自动化所核心人员(左起:陈玉博副研究员、刘康研究员、赵军研究员、何世柱副研究员、张元哲助理研究员)

友情链接
 
中科院自动化研究所 模式识别国家重点实验室 事业单位  京ICP备14019135号-3
NLPR, INSTITUTE OF AUTOMATION, CHINESE ACADEMY OF SCIENCES