华为机器学习服务语音识别功能，让应用绘“声”绘色

2022 年 6 月 24 日
筆記

随着人们对生活的仪式感的追求，移动设备、可穿戴设备、智能家居设备、车载信息娱乐系统也变得越来越流行。在这些应用上，鼠标、键盘这样的交互方式不再便捷，而语音作为人类之间最自然的交流方式，语音识别技术俨然已成为各大应用的“标配”。语音识别场景应用十分广泛，如语音输入法、语音搜索、实时字幕、游戏娱乐、社交聊天、人机交互、驾驶模式等。因此，App里集成语音识别功能不仅能解放双手，也能得到很好的人机交互体验。

1. 业务简介

HMS Core机器学习服务实时语音识别服务支持将实时输入的短语音（时长不超过60秒）转换为文本，可实时识别60秒内的语音。该服务使用行业领先的深度学习技术，随着算法和数据的不断迭代，目前在通用理想环境下的识别准确率可达95%以上。目前支持中文普通话（包括中英文混说）、英语、法语、德语、西班牙语、意大利语、阿拉伯语、俄语、泰语、马来语、菲律宾语的识别。

DEMO演示

2 . 场景介绍

HMS Core机器学习服务实时语音识别服务覆盖日常生活及工作中的众多领域，并且深度优化了购物搜索、影视搜索、音乐搜索以及导航等场景中的识别能力，进一步提高这几类场景的识别准确率。在使用购物类App搜索商品时，可以将语音描述的商品名称或特征识别为文字从而搜索到目标商品。同样，在使用音乐类App时，可以将语音输入的歌名或歌手识别为文字进而搜索歌曲。另外，司机在驾驶过程中不方便输入文字时，可以将输入的语音转换为文字继而搜索目的地，让行车更加安全。

3 . 功能特点

• 支持实时出字

• 提供拾音界面、无拾音界面两种方式

• 支持端点检测，可准确定位开始和结束点

• 支持静音检测，语音中未说话部分不发送语音包

• 支持数字格式的智能转换，例如语音输入“二零二零年”时，能够智能识别为“2020年”。

如何接入华为机器学习服务？

华为机器学习服务官网为您提供详细的文档指导。

了解更多详情>>

访问华为开发者联盟官网
获取开发指导文档
华为移动服务开源仓库地址：GitHub、Gitee

关注我们，第一时间了解 HMS Core 最新技术资讯~