12月9日,在澳大利亚悉尼召开的第15届ACM多模态交互国际会议(ICMI 2013)公布了国际多模态手势识别竞赛(ChaLearn2013)的结果,由实验室卢汉清研究员与程健副研究员带领的团队获得第一名的好成绩。
该团队针对在连续数据流中的非特定用户手势发现与识别问题,提出了一种融合Kinect骨骼与音频数据的快速手势识别算法。在竞赛的最终性能评估环节中,该解决方案的识别错误率仅为0.12756,在所有参赛的54支队伍中排名第一,比第二名的错误率降低了17%。
ChaLearn多模态手势识别竞赛的数据集由微软发布的Kinect传感器采集,包含彩色视频、深度视频、骨骼以及音频数据,数据总时长约24个小时,包含13,858个手势实例,由27名人员进行录制,为非特定用户的手势发现与识别问题提供了优质的测试数据。参赛队伍需根据训练数据集对各自的模型参数进行训练,并提交最终的识别模型,由竞赛组织方在未经公布的测试集上进行评估与排名。ChaLearn手势识别竞赛专注于基于Kinect的手势发现与识别,每届竞赛都能吸引50余支来自不同国家地区的参赛队伍,促进了不同的手势识别算法之间的对比、交流与融合,相信将对学术界与工业界产生深远的影响。
|