模式识别学术大讲堂
Advanced Lecture
Series in Pattern Recognition
题 目 (TITLE):基于深度学习的语音增强
讲 座 人 (SPEAKER):张学良 教授
主 持 人 (CHAIR):刘文举 研究员
时 间 (TIME): 2021年7月12日(周一)17:00-18:00
地 点 (VENUE):智能化大厦3层第5会议室
报告摘要(ABSTRACT):
语音增强从复杂声场中分离出目标人声,是语音智能交互的入口,对移动通讯、助听器设计和自动语音识别有着巨大的价值。传统方法通过对噪声信号的统计特性做出假设、构建模型、估计参数。而在实际环境中,假设很难成立,且参数估计也十分困难,难以满足应用需求。近几年以深度学习为代表的人工智能方法在语音降噪研究中表现突出。本次报告将介绍我们在基于深度学习的单通道和多通道语音增强上的一些研究进展。
报告人简介(BIOGRAPHY):
张学良,内蒙古大学教授,博士生导师。大象声科联合创始人、CTO。2010年于中国科学院自动化研究所,模式识别国家重点实验室获博士学位。2010年进入内蒙古大学计算机学院,从事教学科研工作。2015年-2016年,美国俄亥俄州立大学访问学者。研究方向包括:语音分离/增强,计算听觉场景分析,语音信号处理。主持两项国家自然基金。发表论文包括IEEE/ACM Transactions on Audio Speech and Language Processing、ICASSP、INTERSPEECH等60余篇。2017年创立大象声科,为工业界应用提供基于深度学习的前端降噪方案。目前在手机、TWS耳机、PC和车载场景被大量采用。服务的客户包括:华为、联想、小米、oppo等。
|