中国科学院自动化研究所   设为首页   加入收藏  联系我们
 
English
网站首页     实验室概况     研究队伍     组织机构     学术交流     科研成果     人才培养     开放课题     创新文化     资源共享     联系我们
    学术讲座

2013-9-10 微博文本挖掘介绍

模式识别系列讲座

Lecture Series in Pattern Recognition

 

    (TITLE)微博文本挖掘介绍

(SPEAKER)白栓虎 资深研究员, 新浪微博

(CHAIR)赵军 研究员

     (TIME): 9月10日 (星期二), 2013, 9:30 - 11:30 上午

    (VENUE):第一会议室, 智能化大厦(三层)

报告摘要(ABSTRACT):

讲座主要内容:

(1)微博特点和微博数据挖掘的一些挑战,以及微博文本挖掘的主要工作和应用;

(2)实体相关性及用户群体挖掘、知识图谱建立;

(3)文本流的话题识别和跟踪;

(4)垂直领域信息抽取及意图分析;

(5)文本挖掘在推荐系统中的应用。

报告人简介(BIOGRAPHY):

白栓虎,1985年毕业于山西大学计算机科学系,获学士学位。1992年毕业于清华大学计算机科学与技术系获硕士学位。

1992年加入电子工业部计算机与微电子发展研究中心(CCID),从事国家“中文信息处理开放平台”工作。1995年到新加坡加入苹果电脑研发中心,从事苹果电脑中文语音识别的研发工作,完成苹果第一个中文连续语音识别系统的语言模型并应用到其中文语音识别产品中。在1999年到2002年先后加入爱立信网络应用研究所和Nuance Communication ,从事语音识别应用和对话系统的研发方面工作。从2002年到2010年在新加坡咨询通讯研究院从事语言模型、语音关键词挖掘、人机对话系统的研发工作。

2010年回到国内加入新浪微博。目前是新浪微博资深技术专家,主要在自然语言处理、数据挖掘和推荐技术等相关领域开展技术研发。目前也是“国家科技支撑计划”项目“社交网络监督与互动服务关键技术研发及应用示范”的项目主持人。技术研发方面,目前总共获得4项国外专利,1项中国专利。目前还有多项处于在审状态。其中“中文分词和命名实体识别系统”(US6311152)被谷歌、微软、IBM等多家国际知名公司引用。

承办单位:模式识别国家重点实验室
友情链接
 
中科院自动化研究所 模式识别国家重点实验室 事业单位  京ICP备14019135号-3
NLPR, INSTITUTE OF AUTOMATION, CHINESE ACADEMY OF SCIENCES