Speech recognition with weighted finite-state transducers阅读

2021-10-02 | 0 评论 | 0 浏览

背景

ASR中涉及到的wfst运算有：composition, 确定化determinization和minimization。

WFSA例子

图片.png

(a)是一个LM的例子，完整路径中的每个子路径都是一个单词，完整路径的概率为每个单词概率的乘积。

(b)是LM模型中，单词data可能的发音。每一个合法的发音，是完整路径中音素的字符串，其概率为每个子路径概率的乘积。

(c)是一个从左向右的，三分布的HMM声学模型，对应着一个音素。完整路径中的label，对应着这个音素的声学分布。

WFST例子

图片.png

图片.png

两个acceptor等价，指对于相同的input，都有相同的权重；权重的分布情况可以不同，不做要求。

两个transducer等价，指对于相同的input，都有相同的权重和output；权重和output的分布情况可以不同，不做要求。

不是所有的wfst都可以被determinization，但是无环的wfst都可以被determinization。

图片.png

从某个state出发的所有转移，不能有相同的input label。

如果一个WFST是determinizable的，这个WFST必须是Functional的。

图片.png