NeMo：NVIDIA发布 NVIDIA NeMo，加速语音和语言模型开发

2021-04-05 | 0 评论 | 0 浏览

简介

NeMo是一个更新版本的神经模块，可以用于加快语音和语言模型的开发。

NVIDIA NeMo是一个带有PyTorch后端的开源套件，它能够进一步提高抽象层次。NeMo使用户可以使用可重用的组件轻松地建立复杂的神经网络架构。利用神经类型，这些组件之间会自动进行语义兼容性检查。

NeMo能够利用NVIDIA GPU上的Tensor Core核心，通过混合精度计算来获得最高性能。其包括了将训练扩展到多GPU系统和多节点集群的功能。

NeMo还带有用于ASR、NLP和TTS的可扩展模块集合。此类集合为数据加载、预处理，和训练不同的网络结构（包括Jasper、BERT、Tacotron 2和WaveGlow）提供了API操作。用户还可以基于自定义数据集，使用NVIDIA NGC中的预训练模型进行模型微调。

preview

Jasper语音识别pipeline