语音识别入门技术栈

2019-12-21 | 0 评论 | 0 浏览

概念

语音信号处理/模式识别/统计分析，

常用的深度学习算法，包括
cnn/dnn/rnn/lstm;
GMM/SVM/CRF/MaxEnt/HMM;

对CTC 有经验;

熟悉至少一种深度学习框架，包括 kaldi, tensorflow, caffe, mxnet 等；

常用工具如 Caffe, CNTK, TensorFlow, Pytorch, Kaldi, CTC 技术

熟握 Kaldi, SRiLM, RNNLM, TensorFlow 等社区开源工具中的一种及以上

精通C/C++，Python，Shell编程语言，对数据结构和算法设计有深刻理解；
熟悉C/C++或Python等任意一种编程语言

在学术会议期刊发表过相关论文者优先，有算法优化经验者优先
在相关国际会议或主流期刊上发表论文者优先（ICASSP，Interspeech，ASRU）
在Interspeech，ICASSP等语音学术会议中有论文发表者优先。

计算机、信号处理、自动化