语音识别技术三本书

2019-12-25 | 0 评论 | 0 浏览

概况

《深度学习:语音识别技术实践柳若边》: 定价89RMB, 京东价格61.00, 天猫56.5
语音信号处理第3版第三版语音信号处理基础概念原理方法与应用系统构建Kaldi工具变异语音识: 定价89RMB, 京东价格96.40RMB, 天猫 54.60
新一代人工智能与语音识别：定价44.5，京东价格29.40RMB，天猫30.05

第一本书的第2，3，4章没有什么用。

知识点：

第一本：偏应用，FSA, FST, WFST, nnet3, KenLM
第二本：偏原理，HMM, DNN, RNN, GMM, SVM
第三本：有俄语

目录
第0章绪论1
0.1研究依据1
0.2研究对象与研究目标2
0.3研究方法3
0.4研究意义3
0.5本书的创新点4
0.6语料来源4
0.7本书的结构5
章语音识别技术研究综述7
1.1语音识别的定义与分类7
1.1.1语音识别的定义7
1.1.2语音识别的分类8
1.2语音识别技术的研究进展9
1.2.1语音识别技术的发展概况9
1.2.2国外俄语语音识别技术的研究进展
1.2.3中国俄语语音识别技术的研究进展13
1.3语音识别的基本原理14
1.3.1特征提取15
1.3.2声学模型16
1.3.3语言模型17
1.3.4解码18
1.4语音识别技术研究所关注的关键问题19
本章小结21〖4〗新一代人工智能与语音识别〖2〗目录〖4〗第2章语音数据的加工处理22
2.1问题描述22
2.2众的定义及内涵23
2.2.1众的基本概念23
2.2.2众的基本流程24
2.2.3众的关键问题24
2.3解决方案25
2.3.1质量控制25
2.3.2语音标注平台的架构27
2.3.3标注平台的设计与实现28
2.4语音标注31
2.4.1语音有效性判断31
2.4.2语音转写规范32
2.4.3语音标注规范32
2.5实验设计与结果分析33
2.5.1实验设计33
2.5.2结果分析34
2.5.3结论36
本章小结36
第3章俄语声学模型的建立37
3.1连续语音识别37
3.1.1连续语音识别的整体模型38
3.1.2声学模型训练的HMMGMM方法40
3.1.3声学模型训练中的HMMDNN方法48
3.2俄语语音学概述52
3.2.1俄语的使用及分布情况52
3.2.2俄语语音的基本特点55
3.2.3俄语音素的发音特征56
3.2.4俄语元音音素的随位变化58
3.2.5俄语辅音音素的随位变化60
3.3俄语声学单元的选择61
3.3.1俄语SAMPA音素集61
3.3.2俄语音系表64
3.4实验设计与结果分析64
3.4.1实验设计65
3.4.2结果分析66
本章小结67
第4章俄语语言模型的建立68
4.1文本语料的准备与清洗68
4.1.1数据来源的筛选69
4.1.2数据爬取71
4.1.3数据的去重与清洗71
4.1.4格式化处理74
4.2语言模型简述75
4.2.1语言模型的平滑技术77
4.2.2语言模型的剪枝算法81
4.3语言模型的训练流程84
4.3.1语言模型的训练实现84
4.3.2词典的选择85
4.3.3LM的剪枝与优化87
4.4实验结果分析89
4.4.1词典规模测试89
4.4.2语料规模测试89
4.4.3语言模型剪枝测试90
本章小结91
第5章基于Kaldi的俄语语音识别原型92
5.1设计的目标与原则92
5.1.1设计的目标92
5.1.2设计的原则92
5.2的开发环境与整体架构93
5.2.1的开发环境93
5.2.2的整体架构93
5.3Kaldi环境的搭建94
5.3.1Kaldi及实验环境94
5.3.2Kaldi训练服务器的搭建96
5.3.3AM训练数据及参数设置98
5.3.4LM训练数据及参数设置7
5.4Kaldi训练优化111
5.4.1Kaldi声学建模111
5.4.2GPU加速113
5.5语音识别原型的设计114
5.5.1GUI的设计114
5.5.2在线识别功能114
5.5.3离线识别功能117
5.6实验设计与结果分析119
5.6.1实验设计119
5.6.2实验结果119
5.6.3结果分析120
本章小结121
第6章总结与展望122
6.1本书的主要成果122
6.2未来的研究计划123
附录A英汉术语对照表124
附录B其他相关资料126
B.1俄语发音词典(76277个词形)示例126
B.2俄语解码词表(189971个词形)示例127
B.3俄语字符Unicode编码对照表128
B.4俄语语音格式化程序(转换为16KB、16b)128
B.5俄语文本转Unicode编码程序129
B.6从https: //twitter.com网站上下载的部分网页文件
(json格式)示例131
B.7从http: //www.interfax.ru网站上下载的部分网页
文件(json格式)示例131
B.8俄语拉丁字母转写表132
参考文献134

概况

目录

《深度学习:语音识别技术实践 柳若边》

语音信号处理 第3版

新一代人工智能与语音识别

《深度学习:语音识别技术实践柳若边》

语音信号处理第3版