昆山海菲曼科技申请多国别英语发音数据扩充及识别补偿模型构建专利,有效扩充数据并提升语音识别效果

来源:sina.com.cn 发布时间:Jan 28, 2025, 6:12:00 AM 原地址:https://t.cj.sina.com.cn/articles/view/1829577443/6d0d22e30200256r4

金融界2025年1月28日消息,国家知识产权局信息显示,昆山海菲曼科技集团股份有限公司申请一项名为“一种多国别英语发音数据扩充及识别补偿模型构建方法”的专利,公开号CN 119360882 A,申请日期为2024年10月。

专利摘要显示,本发明涉及一种多国别英语发音数据扩充及识别补偿模型构建方法。该方法首先收集多国别英语发音样本,并进行去噪、分割和格式转换等预处理操作。提取梅尔频率倒谱系数(MFCC)声学特征,并利用RNN和LSTM网络捕获时序特征。通过对抗网络生成不同国别的语音数据,并与真实数据合并构建多国别语音数据库。本方案还包括国别识别模块和语音识别模型的构建,通过LSTM或Transformer架构训练模型,并将国别识别结果作为输入以提高识别效果。本发明能够有效扩充多国别英语发音数据,降低数据收集成本,提升语音识别系统在多样化口音环境下的鲁棒性和准确性。通过技术手段,本方案为全球化背景下的语音识别应用提供了有效的数据支持和模型优化策略。

天眼查资料显示,昆山海菲曼科技集团股份有限公司,成立于2011年,位于苏州市,是一家以从事计算机、通信和其他电子设备制造业为主的企业。企业注册资本3842.498万人民币,实缴资本3842.49万人民币。通过天眼查大数据分析,昆山海菲曼科技集团股份有限公司共对外投资了6家企业,参与招投标项目21次,知识产权方面有商标信息88条,专利信息187条,此外企业还拥有行政许可10个。