FastSpeech2 TTS初体验

  |   0 评论   |   0 浏览

背景

初体验

conda create -n fs2tts python=3.8.5
pip install Flask==1.1.2 tensorflow==2.3.1 pypinyin==0.40.0 soundfile==0.10.3.post1 scipy==1.5.4 -i https://mirrors.aliyun.com/pypi/simple/

下载代码,有135M。

git clone https://github.com/Purkialo/FS2_TTS.git

调用python进行合成

python3 synthesizer.py

原理

[3]

NN-TTS先使用自回归模型从文本生成Mel谱,再生成语音。通常存在推理慢和鲁棒性差的问题。

FastSpeech使用非自回归模型,可以快速生成Mel谱,也避免了鲁棒性差的问题。生成的质量和NN-TTS一样。

目标

预测:

  1. 时长
  2. 音调
  3. 能量

其它

conda连接不上网络

[2]

CondaHTTPError: HTTP 000 CONNECTION FAILED for url [https://repo.anaconda.com/pkgs/main/osx-64/current_repodata.json](https://repo.anaconda.com/pkgs/main/osx-64/current_repodata.json)
Elapsed: -

解决

编译文件 ~/.condarc,内容如下:

channels:
  - defaults
show_channel_urls: true
channel_alias: https://mirrors.tuna.tsinghua.edu.cn/anaconda
default_channels:
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/pro
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
custom_channels:
  conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  msys2: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  bioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  menpo: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  simpleitk: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud

参考

  1. FS2_TTS
  2. 解决Conda无法连接网络的问题
  3. FastSpeech 2: Fast and High-Quality End-to-End Text to Speech