豆包App推出实时语音大模型,中文对话体验再升级

来源:sina.com.cn 发布时间:Jan 20, 2025, 4:41:00 AM 原地址:https://t.cj.sina.com.cn/articles/view/1654203637/629924f50200133ia

豆包官方今日宣布,其实时语音大模型已在豆包App(7.2.0新春版)中全量上线。该模型实现了语音理解与生成的一体化,支持端到端语音对话,显著提升了语音表现力、控制力及情绪承接能力,尤其在中文对话场景中表现突出,具备低时延和可随时打断的特性。

此外,豆包App同步更新了实时语音通话功能,基于全新语音大模型,进一步增强了语音真实感和情绪表现,几乎达到“人机难辨”的交互效果。新功能还能精准把控节奏、儿化音、音量等细节,支持方言、英语对话及多角色模仿,甚至具备部分歌曲演唱能力。

豆包实时语音大模型采用端到端框架研发,深度融合语音与文本模态,实现了从多模态输入到输出的统一建模,为AI语音对话赋予了更多“灵魂”。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。