< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

白交 2024-02-21 16:17:06 来源：量子位

谷歌の“反击”来了

白交发自凹非寺

量子位 | 公众号 QbitAI

谷歌の“反击”来了！

Gemini被Sora抢走的风头，现在有抢回来的势头了。

在最新实测中，Gemini 1.5能分析Sora视频是否AI生成。

是直接给出当中关键因素的那种。

比如这个经典的猫猫视频，Gemini 1.5直言：

它的眼睛和毛都看起来都不像是真的。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

还有像这段生成视频，Gemini 1.5都能说出个一二三造假细节来~

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

都说魔法打败魔法，结果Sora发布这才没几天，就火速被Gemini 1.5“抓出现行”。

对于Gemini 1.5第一波实测结果，网友直呼：that’s scary good，并称其为“游戏规则的改变者”。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

Gemini 1.5第一波实测来了

Gemini 1.5版本突然发布，结果被对面Sora的光芒所掩盖。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

但即便如此，其模型性能的重大升级，尤其是支持100万token上下文窗口，仍让网友们印象深刻。

现在一些博主陆陆续续地拿到了访问资格，开始了第一波实测。

除了能鉴别生成视频真假之外，还有这些令人印象深刻的功能。

1、分解并理解长视频。

比如一场14分钟的NBA扣篮视频，Gemini 1.5能判断出哪个扣篮得分最高，并给出其中扣篮细节。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

整个响应过程大致只需要55秒左右。

2、理解长文本内容，进行比较分析。

博主投喂了《星际穿越》和《星际探索》两个完整的电影脚本，合起来接近10万tokens，要求Gemini 1.5分析比较，以帮助决定观看哪部电影为好。

结果只需三十几秒，就给出了完整详尽的分析报告。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

这样一看，分析其中的剧情台词也就显得小儿科了。

（分析电影中最鼓舞人心的三句话）

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

3、翻译小语种。

即便是那种只有2000人左右使用的语言也能搞定，比如将英语翻译成萨特兰语。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

除此之外，还有像分析理解论文中表格的细节。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

对于这波实测，网友们都表示惊叹：这是个巨大进步，想说可能得等GPT-5来对抗。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

尤其是能处理100万Tokens上下文，这对GenAI初创公司很有用。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

还有网友好奇谷歌是怎么解决上下文窗口大小问题的？

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

一定是发现或实现了什么新东西。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

网友：不太可能是巧合

不过对于谷歌这波“反击”，暂且还未有OpenAI的人出来回应。而此前Sora的发布，也少见有谷歌的人出来评价。

但两家同一天发布，早就有网友浮想联翩：

确实不太可能是巧合。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

奥特曼不想失去谷歌这样一个绝妙的炒作时机。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

有网友认为，Sora宣布显然是一种营销举措，它还没有准备好。相比而言，Gemini 1.5 才是真正的突破。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

但也有人认为，Sora才真正意想不到。

Gemini 1.5 非常棒，但并不令人惊讶。

我非常有信心 OpenAI 内部也有超过 100 万个模型。（Sora是一个副项目）。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

并且认为GPT-5出来之后，会击败所有的竞争对手。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

对于两家这样的操作，你怎么看呢？

One More Thing

两家激战，受伤的是Adobe这类聚光灯之外的玩家。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

这两天股价简直是一跌再跌……

而此前备受关注的视频生成公司Runway，其联合创始人回应：游戏开始了。

值得一提的是，此次国内反应跟ChatGPT那时候有点不一样。

Sora出来之后，少见喊对标的人，比当时要安静多了…

参考链接：
https://twitter.com/rowancheung/status/1759280384930459941

版权所有，未经授权不得以任何形式转载及使用，违者必究。

Gemini 大模型谷歌

空间智能卡脖子难题被杭州攻克！难倒GPT-5后，六小龙企业出手了2025-08-28
陈丹琦有了个公司邮箱，北大翁荔同款2025-08-28
英伟达最新芯片B30A曝光2025-08-20
AI应用如何落地政企？首先不要卷通用大模型2025-08-12

相关阅读

GPT-4o当选“最谄媚模型”！斯坦福牛津新基准：所有大模型都在讨好人类

还发现了缓解模型谄媚行为的方法

一水2025-05-23

大模型

AI做题家卷疯了！高数考试正确率81%，竞赛题成绩超过计算机博士

数理化生全不怕，甚至考过了机器学习……

丰色2022-07-01

AI做题谷歌

哪里不会扫哪里！全球最强数学大模型发布人人可玩Demo，阿里多模态模型加持，中文适用

化身解题神器

衡宇2024-08-20

大模型数学大模型阿里千问

AI正在改写地图APP！这一次轮到谷歌了

所有开发者可通过Gemini API调用谷歌地图工具

一水2025-10-21

谷歌谷歌地图

谷歌砸出10亿美元，要为湾区困难群众，建2万套经适房

啥时候才能当上湾区困难群众啊？

安妮郭一璞2019-06-19

湾区谷歌

7B羊驼战胜540B“谷歌版GPT”，MIT用博弈论调教大模型，无需训练就能完成

把语言解码变成博弈过程

克雷西2023-10-17

大模型

热门文章

合肥又押中AI独角兽：多模态赛道，3个月融了21亿

国产世界模型登顶李飞飞团队榜单！适配国产昇腾算力、代码权重全开源

世界模型“六小龙”在WAIC吵起来了！行业红利就在非共识里

全新统一流式架构，Vivix灵动时刻正式发布首个实时互动模型

菲尔兹奖得主王虹，也发过NeurIPS