“音乐版Sora”首批演示泄露,网友:比写《宫保鸡丁》的Suno好10倍
2024年也是AI音乐生成的元年吗?
丰色 发自 凹非寺
量子位 | 公众号 QbitAI
这两天,一个神秘的“音乐版Sora”产品被盛传即将发布,Suno和它比起来都不算什么。
知情者评价be like:
比Suno强两倍。
模型相当强悍。
人工智能音乐很快就会席卷全球。
(Suno:刚刚火爆的一款AI音乐创作工具,火到200多名音乐人联名签公开信抗议)
正当大家的胃口被吊得十足之时,这个神秘产品的首批演示泄露了。
一首赞颂XGboost算法的Hip Hop风:
一首带着年代感的女声独唱,时长达1分37秒,歌词还在嘲讽Suno:
第一个demo由英伟达工程师Bojan Tunguz发布,随后很快删除,但手快的网友早已存档。
第二个则来自匿名用户投稿。
不得不说,两首曲子咱这“肉耳”听着都相当带感,让人忍不住跟着嗨起来~
有网友甚至评价:
这和Spotify上的歌几乎没什么区别。
“音乐版Sora”初揭秘
随着第一批demo的泄露,这款“音乐版Sora”的真身也被神通广大的网友扒出:
可能是一个叫做Udio的产品。
除了生成高质量的音乐,还有简单的视频生成能力——根据目前的观察,这里的视频应该是带有动态效果的专辑封面。
从网友爆料的接口返回图来看:
Udio支持文字描述生成音乐,比如“一首关于纽约的爵士”;
也支持艺术家风格模仿(但不包括声音);
支持自定义歌词;
也支持对自己喜欢的曲目进行remix;
最后还有一个手动模式。
产品本身还未公开发布,目前采取邀请测试的方式:
Udio官网一打开就只有登陆界面,需要验证资格。
产品本身似乎也对拿到资格的人也提出了要求:
在公开发布之前,不能在社交媒体上发布任何演示内容。(所以英伟达大哥才很快删帖吧)
目前,我们也只看到少量博主称自己得到了试用资格。
包括专门关注AI相关的账号、投资人、电影人等等。
唯一的共同点是,他们给出的评价都很高:
和Sora一个级别,只不过是音乐领域的。
体验完了,不敢相信,Suno只是2024年AI音乐生成的开始。
有人甚至称它比Suno好10倍。但对此,有网友立马站出来反对:
也许是炒作宣传。比Suno好,但应该没有那么强。大家理性吃瓜。
究竟如何我们暂且不论。
值得一提的是,由于目前仅有的两个demo中有一个泄露自英伟达工程师,有网友也大胆猜测两者是否有合作:
英伟达要进军AI音乐产业吗?(手动狗头)
One More Thing
今年的AI音乐圈似乎真有来势汹汹之势:
除了横空出世、备受好评的Suno,几天前Stability AI也卷起来了。
他们发布的新模型Stable Audio 2.0,直接可以创作长达3分钟的音频。
相比之下,Suno目前也只支持2分钟。
而纵观国内,如网易云这种“业内之人”其实也早在搞了。
AI在音乐生成上的“造诣”,咱们就且拭目以待。
参考链接:
[1]https://twitter.com/kimmonismus/status/1776940895197139200
[2]https://x.com/Rom_creating/status/1777082882668065127
[3]https://x.com/Legit4K/status/1777088263691329837
[4]https://twitter.com/maxescu/status/1776899373294584102
[5]https://twitter.com/Legit4K/status/1777007767464673663
[6]https://x.com/mckaywrigley/status/1776328189209723192
- 北大开源最强aiXcoder-7B代码大模型!聚焦真实开发场景,专为企业私有部署设计2024-04-09
- 刚刚,图灵奖揭晓!史上首位数学和计算机最高奖“双料王”出现了2024-04-10
- 8.3K Stars!《多模态大语言模型综述》重大升级2024-04-10
- 谷歌最强大模型免费开放了!长音频理解功能独一份,100万上下文敞开用2024-04-10