来源:so.csdn.net
发布时间:Nov 26, 2020, 3:00:11 AM
原地址:https://blog.csdn.net/weixin_52713150/article/details/110196708
测试语音的输入,主要包括以下几个方面:
①语音输入离拾音设备的距离:近距离、远距离
②拾音设备:移动端(安卓、IOS)原生麦克风、PC端原生麦克风、日常用耳机麦克风、专业设备麦克风(罗技等)
③语音输入与拾音设备的相对位置:正对拾音口,背对拾音口
④语音输入的环境:办公环境、会议室环境
⑤语音输入时的语速:正常语速、语速较快、语速较慢、时快时慢、断断续续
⑥语音输入时的音量:正常音量、音量较大、音量较小,时大时小
⑦语音输入时的音色:男声、女声
⑧语音输入的音频类型:自然人声、录音、广播、变声等
(3)、测试识别内容,主要包括以下几个方面:
①支持识别的语种:普通话、英文、方言等
②支持的应用场景:日常对话、尽职调查、娱乐访谈等
③支持的对话模式:单人对话,多人对话,同一时间只有一个人说话,同一时间多人一起说话
④覆盖的词库内容:根据应用场景,是否包含了应用场景(比如金融、娱乐领域)对应的词库训练
(4)、验证识别内容的准确性
统计识别文字的WER、SER指标
(5)、关注语音识别耗时
①短语音的识别耗时
②长语音的识别耗时