AI作曲调研(一)
背景
MusicLM
Google MusicLM可以从文本生成高品质音乐。其将多条件的音乐生产过程,变为逐层的senquce to senquce的建模过程,生成24kHz品质的长时间的音乐。
在使用上,支持多种生成方式。
- 文本字幕生成 (30秒)
- 长音频生产 (5分钟)
- 故事模式(60 - 120秒)
- 文本和旋律复合模式 (10秒)
- 油画模式 (30秒)
- 其它:器乐、流派、经验水平、地点、年代、手风琴。
同时,Google提供了MusicCaps数据集。
Synthesizer V
Synthesizer V是Synthesizer的第5个版本,是一个歌声合成引擎和编辑器。其使用少量人声数据,即可生成自然的声音。[2]
Synthesizer支持日、英和中文发音人。其中中文发音人的代表曲目有:
- Weina (882RMB):2022年7月
https://www.bilibili.com/video/BV18G411W7sK
- Feng Yi
- Stardust Infinity
- Qing Su青溯(倾诉):2021年10月
https://www.bilibili.com/video/BV1eh411J74T
- Stardust Minus
- Haiyi
- Cangqiong
- Shian
- Chiyu
- AiKO
- An Xiao岸晓 (540RMB):2022年5月
https://www.bilibili.com/video/BV1iY411w7vm/
- Mo Chen默辰 (540RMB):2022年3月
https://www.bilibili.com/video/BV1xY4y1s7Ge/
- Muxin
Synthesizer的发音人和Synthesizer V Studio可以搭配使用,来自行创作歌曲。
VoiceMod
Voicemod是市面上最成熟最好用的变声软件,效果见B站 最好用的变声软件 - Voicemod 全部变声效果测试
VoiceMod下的Your Meme Song Machine软件,可以生成音乐。
其中也有一个文本生成音乐的工具,效果见 Voicemod Text to Song: Free AI Happy Birthday song generator:https://youtu.be/bEwOOAQoTi0
。
其中包括7个发音人,8首曲目风格。
其作曲分为3个步骤:选择 Song, 选择 Singer,编写 Lyrics。制作完成后,可以 Share。
Boomy
Boomy可以生成音乐。用户选出自己要的曲风、乐器、节奏,Boomy会自动生成一段音乐。如果不喜欢,可以拒绝并生成下一首曲子。
Boomy说它已经生成了12,370,203首曲子,占世界总曲目记录的12.08%。
参考
- AI-Generated Music Vocals Are Crazy (New Tech):
https://www.youtube.com/watch?v=TnMYOuc0elc
- Synthesizer V
- 趣AI | 谷歌开发出从文本描述生成音乐的AI作曲系统
- 下一个AI颠覆性应用发生在音乐领域?