昆山海菲曼科技申请多国别英语发音数据扩充及识别补偿模型构建专利，有效扩充数据并提升语音识别效果 | 新浪语音

金融界2025年1月28日消息，国家知识产权局信息显示，昆山海菲曼科技集团股份有限公司申请一项名为“一种多国别英语发音数据扩充及识别补偿模型构建方法”的专利，公开号CN 119360882 A，申请日期为2024年10月。

专利摘要显示，本发明涉及一种多国别英语发音数据扩充及识别补偿模型构建方法。该方法首先收集多国别英语发音样本，并进行去噪、分割和格式转换等预处理操作。提取梅尔频率倒谱系数(MFCC)声学特征，并利用RNN和LSTM网络捕获时序特征。通过对抗网络生成不同国别的语音数据，并与真实数据合并构建多国别语音数据库。本方案还包括国别识别模块和语音识别模型的构建，通过LSTM或Transformer架构训练模型，并将国别识别结果作为输入以提高识别效果。本发明能够有效扩充多国别英语发音数据，降低数据收集成本，提升语音识别系统在多样化口音环境下的鲁棒性和准确性。通过技术手段，本方案为全球化背景下的语音识别应用提供了有效的数据支持和模型优化策略。

天眼查资料显示，昆山海菲曼科技集团股份有限公司，成立于2011年，位于苏州市，是一家以从事计算机、通信和其他电子设备制造业为主的企业。企业注册资本3842.498万人民币，实缴资本3842.49万人民币。通过天眼查大数据分析，昆山海菲曼科技集团股份有限公司共对外投资了6家企业，参与招投标项目21次，知识产权方面有商标信息88条，专利信息187条，此外企业还拥有行政许可10个。

【智能硬件】TTS语音播报控制器：联动控制+音频定时，4通道独立播报

4路TTS语音播报控制器是一种能够将文本信息转换为语音并进行播报的电子设备，具备4路相关控制功能。通常集成有RS485通讯接口，遵循Modbus通信协议，支持设备地址0 - 254更改，支持固定波特率通信，方便与其他设备进行连接和数据传输...

北斗连天地，AI传心声：中国电信首创北斗语音消息

中国电信基于北斗短报文通道，融合AI能力，以自主专利技术实现了北斗语音消息能力。北斗语音消息：技术突破与创新语音消息并非传统短信或语音通话，而是依托我国自主建设的北斗卫星系统，通过自研AI语音编解码算法，将语音内容高效压缩为极少量数据...