Gemini 1.5实测:我看Sora一眼假;还有更多惊艳功能
谷歌の“反击”来了
白交 发自 凹非寺
量子位 | 公众号 QbitAI
谷歌の“反击”来了!
Gemini被Sora抢走的风头,现在有抢回来的势头了。
在最新实测中,Gemini 1.5能分析Sora视频是否AI生成。
是直接给出当中关键因素的那种。
比如这个经典的猫猫视频,Gemini 1.5直言:
它的眼睛和毛都看起来都不像是真的。
![Gemini 1.5实测:我看Sora一眼假;还有更多惊艳功能](/wp-content/uploads/replace/ffeb6346893d050e27634447b0fc6d6a.png)
还有像这段生成视频,Gemini 1.5都能说出个一二三造假细节来~
![Gemini 1.5实测:我看Sora一眼假;还有更多惊艳功能](/wp-content/uploads/replace/ca96529233fe408ac996fbf26f82b07f.png)
都说魔法打败魔法,结果Sora发布这才没几天,就火速被Gemini 1.5“抓出现行”。
对于Gemini 1.5第一波实测结果,网友直呼:that’s scary good,并称其为“游戏规则的改变者”。
![Gemini 1.5实测:我看Sora一眼假;还有更多惊艳功能](/wp-content/uploads/replace/e2a40b02dd3104014273b76908bc7819.png)
![Gemini 1.5实测:我看Sora一眼假;还有更多惊艳功能](/wp-content/uploads/replace/aa6a78e7ba9e5a501bb5162269fc6e0f.png)
Gemini 1.5第一波实测来了
Gemini 1.5版本突然发布,结果被对面Sora的光芒所掩盖。
![Gemini 1.5实测:我看Sora一眼假;还有更多惊艳功能](/wp-content/uploads/replace/1d9e3d881b2f5127a73184e39b377f74.jpeg)
但即便如此,其模型性能的重大升级,尤其是支持100万token上下文窗口,仍让网友们印象深刻。
现在一些博主陆陆续续地拿到了访问资格,开始了第一波实测。
除了能鉴别生成视频真假之外,还有这些令人印象深刻的功能。
1、分解并理解长视频。
比如一场14分钟的NBA扣篮视频,Gemini 1.5能判断出哪个扣篮得分最高, 并给出其中扣篮细节。
![Gemini 1.5实测:我看Sora一眼假;还有更多惊艳功能](/wp-content/uploads/replace/81f45d0a43309bbe9754e4cb09c537c4.png)
整个响应过程大致只需要55秒左右。
2、理解长文本内容,进行比较分析。
博主投喂了《星际穿越》和《星际探索》两个完整的电影脚本,合起来接近10万tokens,要求Gemini 1.5分析比较,以帮助决定观看哪部电影为好。
结果只需三十几秒,就给出了完整详尽的分析报告。
![Gemini 1.5实测:我看Sora一眼假;还有更多惊艳功能](/wp-content/uploads/replace/a2010b386a535d9d734313d866d764a7.gif)
这样一看,分析其中的剧情台词也就显得小儿科了。
(分析电影中最鼓舞人心的三句话)
![Gemini 1.5实测:我看Sora一眼假;还有更多惊艳功能](/wp-content/uploads/replace/cacf09a711b8e0cee3c1eb1297156e8c.png)
3、翻译小语种。
即便是那种只有2000人左右使用的语言也能搞定,比如将英语翻译成萨特兰语。
![Gemini 1.5实测:我看Sora一眼假;还有更多惊艳功能](/wp-content/uploads/replace/182bb389ac804d6133210ae648e87873.gif)
除此之外,还有像分析理解论文中表格的细节。
![Gemini 1.5实测:我看Sora一眼假;还有更多惊艳功能](/wp-content/uploads/replace/165be5ed9684cd54fce2d55d257ff63c.png)
对于这波实测,网友们都表示惊叹:这是个巨大进步,想说可能得等GPT-5来对抗。
![Gemini 1.5实测:我看Sora一眼假;还有更多惊艳功能](/wp-content/uploads/replace/12371df486fe48458a50cc043ca873b6.png)
![Gemini 1.5实测:我看Sora一眼假;还有更多惊艳功能](/wp-content/uploads/replace/1575970ef8605e7c99b60d03e912ce37.png)
尤其是能处理100万Tokens上下文,这对GenAI初创公司很有用。
![Gemini 1.5实测:我看Sora一眼假;还有更多惊艳功能](/wp-content/uploads/replace/37ff4be0c7c4d7b45bc4bb432d204560.png)
还有网友好奇谷歌是怎么解决上下文窗口大小问题的?
![Gemini 1.5实测:我看Sora一眼假;还有更多惊艳功能](/wp-content/uploads/replace/13b71f1f4194709c1d1815ef8e4f2972.png)
一定是发现或实现了什么新东西。
![Gemini 1.5实测:我看Sora一眼假;还有更多惊艳功能](/wp-content/uploads/replace/5f17a5b56eaa2dd649e2bb66490a6e14.jpeg)
网友:不太可能是巧合
不过对于谷歌这波“反击”,暂且还未有OpenAI的人出来回应。而此前Sora的发布,也少见有谷歌的人出来评价。
但两家同一天发布,早就有网友浮想联翩:
确实不太可能是巧合。
![Gemini 1.5实测:我看Sora一眼假;还有更多惊艳功能](/wp-content/uploads/replace/33845bcf279414357f733cee81a2d80b.png)
奥特曼不想失去谷歌这样一个绝妙的炒作时机。
![Gemini 1.5实测:我看Sora一眼假;还有更多惊艳功能](/wp-content/uploads/replace/f552c9c699bf53eddacb8ded4cb80694.png)
有网友认为,Sora宣布显然是一种营销举措,它还没有准备好。相比而言,Gemini 1.5 才是真正的突破。
![Gemini 1.5实测:我看Sora一眼假;还有更多惊艳功能](/wp-content/uploads/replace/9bfdd60e5464f27dc255113a362d62d7.png)
但也有人认为,Sora才真正意想不到。
Gemini 1.5 非常棒,但并不令人惊讶。
我非常有信心 OpenAI 内部也有超过 100 万个模型。(Sora是一个副项目)。
![Gemini 1.5实测:我看Sora一眼假;还有更多惊艳功能](/wp-content/uploads/replace/2162dfb9ce5c45d0a1242bf0917db9ea.png)
并且认为GPT-5出来之后,会击败所有的竞争对手。
![Gemini 1.5实测:我看Sora一眼假;还有更多惊艳功能](/wp-content/uploads/replace/2a9645ad3a8c04b59d3e3f5b5bc3a208.png)
对于两家这样的操作,你怎么看呢?
One More Thing
两家激战,受伤的是Adobe这类聚光灯之外的玩家。
![Gemini 1.5实测:我看Sora一眼假;还有更多惊艳功能](/wp-content/uploads/replace/c45b123b437c2ecb9ff5d05bb23e889c.png)
这两天股价简直是一跌再跌……
而此前备受关注的视频生成公司Runway,其联合创始人回应:游戏开始了。
值得一提的是,此次国内反应跟ChatGPT那时候有点不一样。
Sora出来之后,少见喊对标的人,比当时要安静多了…
参考链接:
https://twitter.com/rowancheung/status/1759280384930459941
- 开源=最强大模型!Llama3.1发布,405B超越闭源GPT-4o,扎克伯格:分水岭时刻2024-07-24
- 国内首批丨腾讯云上架 Llama 3.1模型,支持在 TI 平台精调和推理2024-07-24
- AI视频修复速度10倍提升,过曝变色也能逐帧搞定|美图国科大新算法2024-07-21
- 李飞飞创业:3个月估值破10亿美元2024-07-17