VAENAR-TTS初体验

  |   0 评论   |   0 浏览

背景

初体验

数据准备

中文数据:使用标贝的中文标准女声音库(10000句),供非商业用途使用。

数据:

2.2G (2293620016) BZNSYP.rar
c4350563bf7dc298f7dd364b2607be83  BZNSYP.rar

坑一:请把rar下的所有文件,都扔一个目录中去,不保留rar中的目录结构,因为preprocess.py脚本没有管目录。

创建环境

conda env create -f environment.yml
conda activate vaenartts-env

结果

# To activate this environment, use
#
#     $ conda activate vaenartts-env
#
# To deactivate an active environment, use
#
#     $ conda deactivate

数据预处理

python preprocess.py --dataset databaker --data_dir ../data/biaobei --save_dir ./databaker

如果遇到报错,

FileNotFoundError: [Errno 2] No such file or directory: './databaker/ /007245.npy'

需要改下tf_record_utils.py文件中的68行,

text = np.load(os.path.join(self.data_dir, 'texts', '{}.npy'.format(fid)))
        mel = np.load(os.path.join(self.data_dir, 'mels', '{}.npy'.format(fid)))
        text_len = len(text)

训练

CUDA_VISIBLE_DEVICES=0 TF_FORCE_GPU_ALLOW_GROWTH=true python train.py --dataset databaker --log_dir ./db-log_dir --test_dir ./db-test_dir --data_dir ./databaker/tfrecords/ --model_dir ./db-model_dir

我这里根据显存占用情况情况,调整了一下train_batch_size, test_batch_sizeepochs的值。

推理

CUDA_VISIBLE_DEVICES=0 TF_FORCE_GPU_ALLOW_GROWTH=true python inference.py --dataset databaker --test_dir ./db-test-2000 --data_dir ./databaker/tfrecords/ --batch_size 16 --write_wavs true --draw_alignments true --ckpt_path ./db-model_dir/ckpt-2000

参考