【语音之家】AI技术沙龙——声纹识别 | 新浪语音

由CCF语音对话与听觉专委会、中国人工智能产业发展联盟（AIIA）评估组、北京希尔贝壳科技有限公司、语音之家（北京）科技有限公司共同主办的【语音之家】AI技术沙龙——声纹识别，将于2021年7月17号9:30在线上直播进行。

沙龙简介

做为人类的生物特征之一“声纹”，在刑侦、安防等场景有着广泛应用。每一个人的生理发音器官都有差异，任何人的声纹特征都是独一无二的。声纹识别技术通常用于解决“谁在说话？”的问题，但是仍然面对一些例如发音人个体的生物特征变化、环境噪音等问题的挑战。“文本相关”和“文本无关”是说话人识别的两个系统分类，通过声纹特征准确判断说话人的信息已经在声学以及语音分析技术中被使用，在多人对话场景中对说话人语音内容的准确识别也起到很重要的应用。声纹识别的技术已经应用到人们日常生活的各个角落。

主持人

吴本谷标贝科技AI数据技术负责人

参会嘉宾

洪青阳厦门大学副教授、天聪智能创始人分享内容：声纹识别研究现状和开源工具摘要：声纹识别又称说话人识别，可用来判断用户的身份，在人机交互中起着越来越重要的作用。近几年来，声纹识别技术的发展迅速，在工业界也有越来越多的应用，但仍面临着短语音、噪声干扰、快慢语速和错误标签等诸多挑战。报告将对国内外前沿技术做个综述，然后重点介绍厦大团队的研究进展，包括针对文本相关任务的音素多任务学习、迁移学习，针对错误标签的前后端优化工作。报告还将介绍开源工具ASV-Subtools的最新进展以及实验室其它成果。

嘉宾简介：洪青阳，厦门大学副教授，天聪智能创始人，全国人机语音通讯会议（NCMMSC）常设委员，公安部安防行业标准(SAC/TC100/SC2)委员。主要研究方向为声纹识别、语音识别，先后主持国家自然基金2项，科技部创新基金2项，省杰出青年基金1项，已发表论文60篇以上。2014年8月，参与制定的公安部第一个声纹识别行业标准发布实施。2014年底，主持研发的大规模声纹检索系统分析语音超过10万小时。2015年，主持研发的社区矫正声纹识别系统应用到江苏、广东、辽宁、广西等十三个省市。2018年3月起，研发针对语音唤醒的声纹识别技术，已成功应用于华为手机、耳机等终端产品。2018年11月，带领厦门大学xmuspeech团队在第三届“东方语言语种识别竞赛”获得第一名。2019年1月，成功研发闽南语识别和合成系统。2019年起，研发的语音识别技术应用到司法、电力、证券等行业。2020年6月，出版专著《语音识别：原理与应用》。2020年起，研发的说话人分割聚类技术应用到语音质检等场景中。2020年11月，担任第二届声纹识别研究与应用学术研讨会共同主席。

王东

爱丁堡大学博士、清华大学副研究员

分享内容：声纹识别--等错误率背后的真实性能

摘要：近年来，随着深度学习技术的发展，声纹识别取得显著进步，在SITW, VoxSRC等测试集上已经获得了接近或低于3%的等错误率。然而，直到目前为止，声纹还没有像人脸一样得到广泛应用，研究人员对声纹的推广也持审慎态度。测试数据与实际性能的差异启发我们思考当前评测方法的合理性，并探讨声纹识别本身的基础困难。最近，我们发布了多场景声纹识别数据库CNCeleb，并基于该数据库对复杂真实场景下的性能进行了若干研究。研究结果表明，当前声纹识别技术可能还无法满足复杂场景下的性能要求，多场景、跨场景、场景泛化是未来声纹识别研究面临的一个主要困难。

嘉宾简介：王东，爱丁堡大学博士，清华大学副研究员，人工智能研究院听觉研究中心副主任，IEEE 高级会员，长期从事语音语言相关技术研究，在领域主要杂志和会议上发表论文150余篇，著有《人工智能》《机器学习导论》《语音识别基本法》等著作。

李明

昆山杜克大学电子与计算机工程副教授

分享内容：面向复杂场景的高可靠性声纹识别及其关联任务研究摘要：首先描述面向复杂场景的声纹识别这一具有挑战性的任务；其次介绍实验室在远场声纹识别领域的近期研究成果；最后，扩展到多个使用声纹编码的语音关联任务的工作，如特定人唤醒，特定人合成与变声，特定人分离等。嘉宾简介：李明，昆山杜克大学电子与计算机工程副教授，大数据研究中心研究员，武汉大学计算机学院兼职教授，博导，第十五批江苏省六大高峰B类高层级人才。2005年获南京大学通信工程专业学士学位，2008年获中科院声学所信号与信息处理专业硕士学位，2013年毕业于美国南加州大学电子工程系，获工学博士学位。2013-2017年任教于中山大学卡内基梅隆大学联合工程学院及电子与信息工程学院，副教授，博士生导师。2018年加入昆山杜克大学，研究方向包括智能语音处理，多模态行为信号分析等方向。已发表学术论文130余篇，现担任IEEE语音及语言技术委员会委员，中国计算机学会语音对话与听觉专委会委员，中国人工智能学会人工心理与人工情感专委会委员, APSIPA 语音及语言处理专委会委员，IEEE学会高级会员。担任Interspeech2016，2018及2020说话人语种识别领域主席。带领团队于2011,2012,2019三次获得了INTERSPEECH Computational Paralinguistics Challenge子任务第一名，ASRU19阿拉伯语语种识别第一名, interspeech20 fearless steps 说话人识别第一名, interspeech21 fearless steps 说话人识别及说话人日志第一名，获得IEEE DCOSS2009最佳论文奖，ISCSLP2014最佳学生论文奖。2016年被授予IBM Faculty Award，2018年被授予ISCA 5年最佳期刊论文奖，2020年被授予教育部第八届高校科学研究优秀青年成果奖。

沙龙议程