语音测试用例 | CSDN语音

测试语音的输入，主要包括以下几个方面：
①语音输入离拾音设备的距离：近距离、远距离

②拾音设备：移动端(安卓、IOS)原生麦克风、PC端原生麦克风、日常用耳机麦克风、专业设备麦克风(罗技等)

③语音输入与拾音设备的相对位置：正对拾音口，背对拾音口

④语音输入的环境：办公环境、会议室环境

⑤语音输入时的语速：正常语速、语速较快、语速较慢、时快时慢、断断续续

⑥语音输入时的音量：正常音量、音量较大、音量较小，时大时小

⑦语音输入时的音色：男声、女声

⑧语音输入的音频类型：自然人声、录音、广播、变声等

(3)、测试识别内容，主要包括以下几个方面：

①支持识别的语种：普通话、英文、方言等

②支持的应用场景：日常对话、尽职调查、娱乐访谈等

③支持的对话模式：单人对话，多人对话，同一时间只有一个人说话，同一时间多人一起说话

④覆盖的词库内容：根据应用场景，是否包含了应用场景(比如金融、娱乐领域)对应的词库训练

(4)、验证识别内容的准确性

统计识别文字的WER、SER指标

(5)、关注语音识别耗时

①短语音的识别耗时

②长语音的识别耗时