语音识别入门技术栈

  |   0 评论   |   0 浏览

概念

语音信号处理/模式识别/统计分析,

算法

常用的深度学习算法,包括
cnn/dnn/rnn/lstm;
GMM/SVM/CRF/MaxEnt/HMM;

对CTC 有经验;

框架

熟悉至少一种深度学习框架,包括 kaldi, tensorflow, caffe, mxnet 等;

常用工具如 Caffe, CNTK, TensorFlow, Pytorch, Kaldi, CTC 技术

熟握 Kaldi, SRiLM, RNNLM, TensorFlow 等社区开源工具中的一种及以上

语言

精通C/C++,Python,Shell编程语言,对数据结构和算法设计有深刻理解;
熟悉C/C++或Python等任意一种编程语言

paper

在学术会议期刊发表过相关论文者优先,有算法优化经验者优先
在相关国际会议或主流期刊上发表论文者优先(ICASSP,Interspeech,ASRU)
在Interspeech,ICASSP等语音学术会议中有论文发表者优先。

领域

计算机、信号处理、自动化

来源