7月3日上午,全国政协第十二届委员、中央档案馆原馆长、国家档案局原局长杨冬权调研自动化研究所。自动化所副所长刘成林、文化大数据工程中心副主任王健等陪同调研。
杨冬权了解了研究所在文字识别软件、汉字文化大数据、软笔书法字识别等方面的科研进展,体验了智能书法台。
座谈期间,刘成林介绍了自动化所的整体情况和模式识别国家重点实验室模式分析与学习团队在手写文档识别(包括字符识别、版面分析、字符串识别等)、自然场景文字检测与识别等方向的研究成果和应用。杨冬权对自动化所在文字识别领域做出的杰出成就表示由衷的钦佩,表示此行获益良多。
杨冬权谈到,中央档案馆约有上千万件总计上亿页档案文件,全国各省、市和县等每个档案馆存量也有几千万页。如何将档案馆的资料进行数字化处理,将文字图像转化为电子文本是未来几年内档案馆的重中之重工作。档案资料的数字化工作,将主要用于档案的(关键词)检索,并决定了存储和检索的精准与高效。
刘成林表示,希望在近期可以实地考察档案馆,了解其档案的规模及形态,并在今后开展合作的过程中能够得到大力支持。
|