神秘「蓝莓」登顶文生图竞技场,疑似Flux续作,网友:都来打广告
实测就能发现蛛丝马迹
明敏 发自 凹非寺
量子位 | 公众号 QbitAI
都来玩这套。
继OpenAI“草莓”之后,又有神秘模型蓝莓来“霸榜”。
在文生图模型排行榜上,两个“无人认领”的模型blueberry_0和blueberry_1力压Flux.1、Ideogram v2、Midjourney v6.1等知名模型,成为最新榜一榜二大哥。
一些生成效果be like,确实不错。
不过这一次,未必是OpenAI跨界来搞事,背后公司更可能是打造了Flux的黑森林实验室。
为啥?
来看这组PK。blueberry_0生成的大胡子男人,和Flux Pro的几乎一模一样。
有人猜测,难道是Flux的新版本?
我们实测时也发现了类似的情况,blueberry_1在同一提示词下,生成图像从构图、光线到细节,与Flux.1[pro]非常像。
有网友就评论说,这真的很有意思。
公司在发布新模型之前先把它放在模型竞技平台上,大多数时候用户也能猜的出来它来自哪家公司。
……
这几乎是一种免费打广告的形式了。而且就是能吸引到目标用户。
对提示词理解更精准
现在,在竞技场中随机匹配即可“偶遇”两个蓝莓模型。
从实际生成效果中可以找寻出蓝莓模型的一些特点。
比如和Midjourney v6.1对比,blueberry_1在细节和真实性上更好。
Midjourney生成的人物手部不够自然,眼睛看着的是桌子而不是收银机,背带裤扣子也很奇怪。
相对而言,blueberry_1整体更协调,光线更自然。
和Stable Diffusion XL 1.0比较,写实性更好。
和FLUX.1[dev]对比,blueberry_0对提示词的理解更精准,细节处理能力更强。
提示词中提到的山谷中充满神秘物种,FLUX.1[dev]只画了一个。
但是也有一些情况,blueberry_0的表现不算突出。觉得谁更好或许就见仁见智了。
除此之外,还有网友发现蓝莓模型在生成图像中的文本上表现不佳。
从数据上来看,两个蓝莓模型之间的差距并不大。从生成质量和速度两个维度评判,它们也都处于第一梯队。
相对而言blueberry_0的生成质量更高一点点。如下结果是基于模型在竞技场中PK10000次以上后进行评定。
生成速度上也是blueberry_0更快。
竞技场胜率上,blueberry_0排第一,Flux.1[pro]第二,blueberry_1第三。
网友:是OpenAI还是黑森林?
目前还无人认领“蓝莓”模型,网友们的猜测还在继续。
有人觉得它在细节上还有很多问题,不太可能是OpenAI的模型。
比如小屋出现了两个门把手。
下图人物被挡住的胳膊和手有问题。
但也有人说,最近OpenAI员工透露会有新模型,有可能是OpenAI悄悄发布。
当然,也有人质疑“蓝莓”模型分数虚高,在一些情况下它的表现不及Dall·E 3。
我感觉结果被操纵了,这样它们就能拿着这些成绩去给投资人看。“蓝莓”很明显就是参考了“草莓”的做法,而“草莓”模型就很可疑。
你觉得呢?
现在也可以去竞技场上实测“蓝莓”模型效果。
传送门:
https://artificialanalysis.ai/text-to-image/arena
参考链接:
[1]https://www.reddit.com/r/singularity/comments/1fpwuu7/a_new_mysterious_image_gen_model_called_blueberry/
[2]https://x.com/search?q=Blueberry%20Black%20Forest%20Labs&src=typed_query
- 百度智能云晒大模型落地成绩单:5个第一!2024-09-25
- 谷歌AI芯片AI设计!端到端闭环,三星联发科都buy in了2024-09-27
- OpenAI连丢3高管,光杆司令奥特曼紧急扶持华人上位!半年流失15员大将2024-09-26
- GPT-4o能玩《黑神话》!精英怪胜率超人类,无强化学习纯大模型方案2024-09-22