< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

AI玩起音乐“天赋”惊人，听听新加州旅馆？还是熟悉的老鹰乐队嗓

赖可 2020-05-01 13:54:58 来源：量子位

赖可发自凹非寺
量子位报道 | 公众号 QbitAI

AI把一首歌重新唱一遍，会是什么感觉？还是那个歌手，还是那个歌词，却是全新的旋律，全新的风格。

先试听一下吧。

Eagles乐队的Hotel California，第一段还是原调，唱着唱着就突然变了：

第一遍听没有听歌词，真的以为变成了另一首歌，最后还加了一段纯乐器：

On a dark desert highway，cool wind in my hairWarm smell of colitas

rising up through the airUp ahead in the distance

I saw a shimmering lightMy head grew heavy and my sight grew dim（开始变调）

I had to stop for the night

There she stood in the doorway

I heard the mission bell

And I was thinkin’ to myself ‘This could be heaven or this could be hell

(music……）

虽然不熟悉，还真的蛮好听，这个AI乐感不错呀！（反正超过我了）

最新的合成器：Jukebox

AI科学家一直在尝试，用神经网络合成语音和音乐。

上面的歌曲你也听过了，它是Open AI 最新研究出的神经网络：Jukebox。它将乐器和人声的混合的复杂音频，进行再处理，尽可能追求顺畅效果。

我们之所以选择音乐工作，是因为我们希望继续突破生成模型的界限。

它是怎么实现的呢？

Jukebox使用了一种称为VQ-VAE的量化方法，将音频压缩到离散空间。分层VQ-VAE可以从几个演奏的样本中生成简短的乐器片段。

分层处理

所谓的分层方法，就是分为三层将44kHz原始音频压缩为8x，32x和128x。主要有两个步骤。

压缩：每层都独立地进行编码。底层编码进行重构，而顶层编码只保留了基本的音乐信息。

生产：也是分层进行，一系列的transformers会从上到下生成代码，最后，下层的解码器将它们转换为原始音频。

当然，能生成目前效果的歌曲，也是因为数据库足够丰富，看一眼就知道了：

传送门

目前这个神经网络也有局限，产生不了常见大型音乐结构，例如和声和重复。科学家还在进一步努力中。

如果你想听更多其他AI制作的音乐样本，可以去官网试试：

https://openai.com/blog/jukebox/#rf7

一个小彩蛋：发现了一首深度学习之歌

Deep learning ，deep learning

The deeper you learn, the smarter your A. I.

Deep learning, big dataBig model, accuracy

We must, we must,we must go deeper…………

— 完 —

AI音乐加州旅馆模型生产

赖可

看「菊纹」，知疾病，这个智能马桶，知道你下半身的所有秘密2020-04-12
这拖拉机你能开算我输：美国少女“揭秘”现代拖拉机驾驶室2020-05-05
史上最大“云办公”实验开始，你参加了吗？2020-02-04
英伟达上线游戏云服务平台GeForce Now，每月4.99美元2020-02-05

AI玩起音乐“天赋”惊人，听听新加州旅馆？还是熟悉的老鹰乐队嗓

最新的合成器：Jukebox

分层处理

传送门

相关阅读

中国AI音乐，悄悄把全球第一拿走了

全球首个AI流媒体音乐App来了！中国造的

他用AI办了个音乐节，主题：别读博

一代偶像终将老去，总有AI正在年轻

让莫扎特“续写”披头士的音乐，OpenAI的新AI作曲能力强丨Demo可玩

“音乐版Sora”首批演示泄露，网友：比写《宫保鸡丁》的Suno好10倍

热门文章

李飞飞的世界模型，终于开始训练机器人了

GPT-5.6自己优化自己实锤了，新的左脚踩右脚已经出现

学习强国做了个AI社区，两周铺进68座城市

Kimi K3、Unlimited OCR包揽全球前二，中国开源模型持续刷屏海外

陶哲轩在菲尔兹颁奖现场：数学迎来百年新危机