AI语音技术的架构（学习心得） - ⎝⎛CodingNote.cc ⎞⎠

AI语音技术的架构（学习心得）

2020 年 4 月 27 日
AI
声纹识别, 对话系统, 智能客服, 自然语言处理, 语义识别, 语音交互, 语音识别技术

AI 语音技术架构：

AI 的语音技术现在在各种终端上都已经普及开，比如个大厂商的智能音箱，都运用了该技术。

以智能音箱为例，AI 语音技术的架构为：

首先人类通过唤醒词，唤醒设备
发出语音指令：比如“今天天气如何？”
通过语音识别技术，将语音信息转化为文本信息
文本信息通过 NLP 技术理解其内在含义
通过深度学习模型/或者问答库找到合适的答案
通过 NLP 技术形成答案的文本
通过语音合成技术将文本信息转化为语音信息
通过智能音箱进行语音输出

要让机器理解语音的含义，我们需要两个模型：
一个是声学模型，一个是语言模型
前者是将语音转化为文本
后者是理解文本的含义

Tags: 声纹识别对话系统智能客服自然语言处理语义识别语音交互语音识别技术

Previous post

魅族17官宣：松深入墨新配色+6400W IMX686横置五环式影像系统

Next post

python信息收集（二）