腾讯会议推天籁语音模组方案

来源:sina.com.cn 发布时间:Jul 9, 2021, 10:09:00 AM 原地址:https://t.cj.sina.com.cn/articles/view/2833534593/a8e44e8102000tx12

品玩7月9日讯,为了应对复杂声学场景下的实时语音通信技术挑战,解决企业会议室开会难题,腾讯会议旗下天籁实验室近日推出天籁语音模组方案,由腾讯AI Lab多项技术加持,实现12米超长距离拾音,消除超过200种会议噪声,在双讲,回声消除等方面实现突破性升级。

腾讯称,腾讯会议基于会议室的特定场景,推出天籁语音模组方案,首次结合房间声场感知、采集和空间声场重建技术,开创性地解决了会议室复杂场景下,远场多人音频通信、多讲话人实时追踪、多人自动取景等实时音视频技术难题,帮助企业和用户实现在远场复杂物理空间下通信体验的突破性提升。

例如,同一会议室中,随着人与音视频设备的距离变远,声音在传播过程中也会逐渐减弱,因此参加企业培训、工作汇报等企业会议时,最常见的一个现象就是听不清甚至听不到。针对这一点,天籁语音模组方案将多个MEMS麦克风板嵌入到会议大屏中,结合音频处理器,能够实现180度广角、12米超长距离拾音,相当于参会者即使相隔4层楼的距离,也完全可以像面对面交流般清晰、自然,给予参会者更灵活的活动空间,让其在自由不设限的氛围中开展讨论。

在远程会议中,很多人经常会遇到延迟而导致的声音卡顿、声音忽快忽慢,甚至与会者同时安静或同时说话等尴尬的情况,极易破坏会议沟通思路,影响会议沟通进度。为了解决这一痛点,天籁语音模组方案突破性地将设备上行时延降低至几十毫秒,可以让远程语音交流如面对面交谈般实时。

值得一提的是,针对多人同时说话时声音明显失真现象,天籁语音模组方案则能有效实现双讲无剪切、无回声泄露、无近端语音抑制,有效确保多人讨论时,每个人的声音都听得见、听得清、听得真,提升会议参与感。天籁语音模组还基于深度学习模型,不仅可以将空调声、风扇声等平稳噪声的降噪深度提高至40dB,还对包括写笔触屏声、键盘声、手指敲桌子、放水杯、翻纸等会议室场景下超200种各种突发噪声进行针对性消除,提升语音信噪比,为用户打造更加专注高效的会议氛围。

据了解,该方案将应用于腾讯会议Rooms专款机型上,并已率先授权开放给腾讯会议Rooms专款硬件合作伙伴,助力打造会议室场景高清、纯净、流畅的开会体验。与此同时,不做硬件的腾讯会议,目前还通过开放音视频认证标准,联合硬件设备厂商,共同为企业量身打造“软硬一体”的云视频会议解决方案。