高质量训练数据集赋能标贝语音识别再添新语种

人工智能蓬勃发展的今天,人工智能产品在生活中的渗透率越来越高,常见的如手机语音助手、智能音箱、车载语音交互、IOT物联网等已经与生活密不可分。其中,语音识别技术作为连接人与机器沟通的基本途径之一,也成为了行业关注焦点,迎来快速发展阶段。

近日,标贝科技全新推出英语语音识别能力,得益于海量的数据基础及深度学习平台,英语语音识别的准确率得到全面提升,助推语音交互技术在更多场景的落地应用。

标贝英语语音实时识别词准率达95%以上

人机交互主要解决如何让机器听得懂,并作出正确的回应,因而语言识别和自然语言处理能力尤为重要。标贝科技此次推出的英语语音识别功能完全基于标贝自研的深度神经网络训练声学模型进行研发,通过大量英语语料数据,不断对识别模型进行优化训练,从而让语音识别准确率获得大幅提升,英语语音识别词准率高达95%。

此外,标贝英语语音识别可以支持一句话、长语音、录音文件三种形式的识别转写,同时还能根据应用场景需要,针对特定词汇识别效果进行优化定制,适用于不同场景下的美式英语、英式英语、中英文混合识别,提升用户交互体验。

打造数据工场构建10万小时自有数据库

众所周知,基于机器学习的各种技术,往往都需要使用大量的数据来训练,语音识别的准确率更是离不开算法和数据的积累。实际应用中,数据作为机器学习的基础,很多时候数据质量的好坏对总体性能的影响甚至超过了算法本身。斯坦福大学副教授、Coursera联合创始人吴恩达,曾经强调数据质量对于AI的重要性:80%的数据+20%的模型=更好的AI。

因此,在当前人工智能产业发展进入场景应用的关键时期,对数据质量提出了更高的要求。自成立起,标贝科技扎根AI数据服务领域,自研一站式数据采标平台-数据工场,全方位支持文本、语音、图像、视频等各类型数据的处理,为企业客户提供数据采集、标注等定制化数据解决方案,满足不同行业、多类型的场景化数据需求,持续提升数据产能和效率。

目前,标贝科技构建了大规模、多语种的AI语音数据库,总时长超过10万小时,其中英文数据库包含中式、英式、美式三种发音方式以及自由对话和朗读两种形式,覆盖儿童,青少年,成人全年龄段。本次推出的英语语音识别系统就是基于儿童英文数据库、美式英文朗读与对话数据库、英式英语数据库、中国成人说英文数据库、中国青少年英文数据等近万小时的优质英语语音数据进行模型训练,在深度学习神经网络算法加持下,能够保证系统可以快速的输出高准确率的识别结果。

*以上数据库列表仅为部分内容,如需完整数据库请联系我们

标贝科技数据业务相关负责人表示,数据标注行业的发展已经越来越趋向于专业化,客户需求已经从早期较简单的、通用的数据过渡到更复杂的多语种、个性化的、场景化的数据,对于很多细分领域,需要大量真实的模型进行标注去迭代优化。标贝科技基于深度学习及高精度预处理技术,自研的一体化数据采标平台,在AI数据生产中,通过严格专业的立项设计、数据采集加工处理、语音标注校对及结构处理等系列管理流程,快速产出高质量数据,与算法、模型、架构等进行深度匹配,形成可进行落地的产品形态,在保证质量的前提现下可以真正提高效率,让用户享受到更快速、更准确的英语语音识别服务。

立足业务场景突破AI数据应用价值

多年行业深耕,标贝科技积累了丰富的行业经验和案例,连续两年入选年度数据标注公司排行榜单TOP10,助力自动驾驶、电商、智能客服、智能家居、社交娱乐、融媒体等领域头部企业客户智能语音交互业务上线,并获得众多用户的信赖与认可。

未来,随着人工智能、5G、IoT等技术的成熟,作为联动各智能设备终端的关键通道,语音识别、语音合成等智能语音交互技术将得到更广泛的落地应用。标贝科技将持续聚焦场景化的数据服务,在技术创新和场景应用的双轮驱动之下,进一步提升人机协同的准确率和效率,为AI产业发展提供更多种类、更大规模、更高价值的数据服务,助力人工智能产业生态链进一步完善。

（责任编辑：张晓波）

高质量训练数据集赋能 标贝语音识别再添新语种