FastSpeech2 TTS初体验
背景
初体验
conda create -n fs2tts python=3.8.5
pip install Flask==1.1.2 tensorflow==2.3.1 pypinyin==0.40.0 soundfile==0.10.3.post1 scipy==1.5.4 -i https://mirrors.aliyun.com/pypi/simple/
下载代码,有135M。
git clone https://github.com/Purkialo/FS2_TTS.git
调用python进行合成
python3 synthesizer.py
原理
[3]
NN-TTS先使用自回归模型从文本生成Mel谱,再生成语音。通常存在推理慢和鲁棒性差的问题。
FastSpeech使用非自回归模型,可以快速生成Mel谱,也避免了鲁棒性差的问题。生成的质量和NN-TTS一样。
目标
预测:
- 时长
- 音调
- 能量
其它
conda连接不上网络
[2]
CondaHTTPError: HTTP 000 CONNECTION FAILED for url [https://repo.anaconda.com/pkgs/main/osx-64/current_repodata.json](https://repo.anaconda.com/pkgs/main/osx-64/current_repodata.json)
Elapsed: -
解决
编译文件 ~/.condarc
,内容如下:
channels:
- defaults
show_channel_urls: true
channel_alias: https://mirrors.tuna.tsinghua.edu.cn/anaconda
default_channels:
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/pro
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
custom_channels:
conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
msys2: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
bioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
menpo: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
simpleitk: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud