VAENAR-TTS初体验
背景
初体验
数据准备
中文数据:使用标贝的中文标准女声音库(10000句),供非商业用途使用。
数据:
2.2G (2293620016) BZNSYP.rar
c4350563bf7dc298f7dd364b2607be83 BZNSYP.rar
坑一:请把rar下的所有文件,都扔一个目录中去,不保留rar中的目录结构,因为preprocess.py脚本没有管目录。
创建环境
conda env create -f environment.yml
conda activate vaenartts-env
结果
# To activate this environment, use
#
# $ conda activate vaenartts-env
#
# To deactivate an active environment, use
#
# $ conda deactivate
数据预处理
python preprocess.py --dataset databaker --data_dir ../data/biaobei --save_dir ./databaker
如果遇到报错,
FileNotFoundError: [Errno 2] No such file or directory: './databaker/ /007245.npy'
,
需要改下tf_record_utils.py
文件中的68行,
text = np.load(os.path.join(self.data_dir, 'texts', '{}.npy'.format(fid)))
mel = np.load(os.path.join(self.data_dir, 'mels', '{}.npy'.format(fid)))
text_len = len(text)
训练
CUDA_VISIBLE_DEVICES=0 TF_FORCE_GPU_ALLOW_GROWTH=true python train.py --dataset databaker --log_dir ./db-log_dir --test_dir ./db-test_dir --data_dir ./databaker/tfrecords/ --model_dir ./db-model_dir
我这里根据显存占用情况情况,调整了一下train_batch_size
, test_batch_size
和epochs
的值。
推理
CUDA_VISIBLE_DEVICES=0 TF_FORCE_GPU_ALLOW_GROWTH=true python inference.py --dataset databaker --test_dir ./db-test-2000 --data_dir ./databaker/tfrecords/ --batch_size 16 --write_wavs true --draw_alignments true --ckpt_path ./db-model_dir/ckpt-2000