Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了:想要访问权限
GPT-5或许能实现屏幕共享?
西风 发自 凹非寺
量子位 | 公众号 QbitAI
谷歌Gemini修改bug让网友大开眼界!
X一小伙分享,为测试Gemini 1.5 Pro,自己在编写一个网页的代码时故意留了3个bug,并分别录制了网页bug视频。
接着把代码库打包成文件连同视频一起输给了Gemini 1.5 Pro,提示它找到并修复代码中的所有bug,且要提供一个简要指南以及所做更改的说明。
没想到,Gemini 1.5 Pro还真就分分钟正确识别并修复了每一个bug。
![Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了:想要访问权限](/wp-content/uploads/replace/5d93b2cc9c552a3dad51df2f4d6a4f2a.png)
小伙将这种玩法po出来后热度不断攀升,网友们纷纷一键三连,转赞收藏量过万。
其本人还在评论区强调,“这只是一个简单的例子,也将是它最差的表现”,Gemini这小汁前途不可限量啊。
![Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了:想要访问权限](/wp-content/uploads/replace/37a95f14f35c2a8777e09f42d3c7f555.png)
有网友表示想起来一件事觉得有趣:英伟达黄院士前段时间曾公开表示“孩子们以后不需要学编程了”,那时候还有很多人反对称“AI不会取代程序员”。
![Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了:想要访问权限](/wp-content/uploads/replace/e06dbac3533328cef748ec37130af489.png)
但甭管怎么说,AI可以给程序员提供帮助是有目共睹的。
![Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了:想要访问权限](/wp-content/uploads/replace/fd60b9c39b64ce9e1c8f810e238357e2.png)
接下来我们展开来看Gemini 1.5 Pro修复bug的经过。
事件经过
正如开头提到的,网友先是在编写网页代码时故意写错了3处:
![Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了:想要访问权限](/wp-content/uploads/replace/14f0651a9dfe0a55c94eb952ea6d9565.gif)
这就导致网页上的一些功能操作无法正常运行,于是小伙分别拍摄了3处无法正常运行的视频,每个视频十几秒。
然后将视频连同代码库一起输给了Gemini 1.5 Pro。
prompt为:
Fix the bugs in my code.Create a simple markdown guide for me to fix them,and then write the actual code to fix the bugs.I need the full code like it’s for a complete PR so I am make the changes.(修复我代码中的bug,为我创建一个简单的Markdown指南以修复bug,然后编写实际的代码来修复。我需要完整的代码,就像它是为了一个完整的Pull Request一样,这样我才能进行更改。)
![Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了:想要访问权限](/wp-content/uploads/replace/2e31b5e382f8ce024e8f7acfd076f037.gif)
随后,Gemini 1.5 Pro立刻准确识别了3个bug:
- 点击一个待办事项并不会将其标记为完成/未完成
- 主题切换器不会切换主题
- 点击登录按钮不会触发任何操作
![Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了:想要访问权限](/wp-content/uploads/replace/99a9596b392bc2fefc42ad7f74728f4d.gif)
紧接着就分别给出了修复方案,附带代码:
![Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了:想要访问权限](/wp-content/uploads/replace/372dd66b03faf39fdc14ac422e703799.gif)
小伙仔细对照自己敲的代码,确认Gemini 1.5 Pro给出的答案是正确的:
![Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了:想要访问权限](/wp-content/uploads/replace/a8426771cbd559451dc79f3eacd15839.gif)
小伙还强调,这3个bug在代码库文件中其实离着很远,这也就意味着Gemini 1.5 Pro确实读完了完整的上下文。
![Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了:想要访问权限](/wp-content/uploads/replace/03f906bd8cc1cb2045cdc26dd523568a.gif)
“想要访问权限”
网友看到这一系列操作后激动搓手,直呼想要Gemini 1.5 Pro访问权限:
![Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了:想要访问权限](/wp-content/uploads/replace/4a91c95094f2aeac858b7d83c22d7cb6.png)
![Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了:想要访问权限](/wp-content/uploads/replace/db97899d2b9bb50c8216e98b0d2462ef.png)
除坐等外,还有网友表示用GPT-4帮忙修复代码也很好使,顺带畅想了一下GPT-5:
接下来可能是实时交互?或许能与GPT-5进行屏幕共享?
![Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了:想要访问权限](/wp-content/uploads/replace/06419e0ffddafb5bf6606d4a16df732f.jpeg)
而另一边已经获得访问权限的网友早就玩嗨了。
比如,一次性输给Gemini 1.5 Pro最新的10篇论文,让它从中找到一个作者的电子邮件地址。
结果Gemini 1.5 Pro第一次就成功找到了:
![Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了:想要访问权限](/wp-content/uploads/replace/47e6eca175f989d91942204be81177cc.png)
然后又让Gemini 1.5 Pro从超360000token的《哈利·波特与凤凰社》整本书中找到一句话的说话人,Gemini 1.5 Pro也成功找到了。
![Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了:想要访问权限](/wp-content/uploads/replace/d368821c87dc7254890d7404acfbd80f.png)
![Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了:想要访问权限](/wp-content/uploads/replace/ee4412c75232c9d05c22a13478b72984.png)
测试继续上难度,一次性输入三本书,Gemini 1.5 Pro最后用时约1分钟再次成功找到对应的说话人:
![Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了:想要访问权限](/wp-content/uploads/replace/ea6061853c86bcf5f30636c2d0c562af.png)
惊讶之余,这位测试者总结了Gemini 1.5 Pro的逻辑推理能力:
对于常规提示,接近GPT-4的性能。
但当我添加数十个例子时,Gemini的性能在提升,似乎没有上限。多示例提示成为了新的微调方法。
![Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了:想要访问权限](/wp-content/uploads/replace/2cb7f3ebe4fb9607f1d436035ec9a22f.png)
沃顿商学院教授Ethan Mollick也来整活了。输给Gemini 1.5 Pro一本352页的《太空60年》规则手册,约250000token,然后要求它扮演一个角色。
即使说明书分散在很多页上,而且非常复杂,但Gemini“似乎明白了”:
![Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了:想要访问权限](/wp-content/uploads/replace/38e7b3e64a84294a49138a10d6586c0b.jpeg)
Ethan Mollick教授表示,对所有其他AI进行这项测试都是失败的,只有Gemini 1.5 Pro成功了。
![Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了:想要访问权限](/wp-content/uploads/replace/8ae3c49819a1e2c38ed3a844539c0004.png)
这位网友想要编译整个X算法的代码存储库并将其上传到Gemini 1.5 Pro,正在线向网友征集想问的问题。
![Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了:想要访问权限](/wp-content/uploads/replace/fb1e2a8e263db7caab8a79f71257a1c9.png)
只见编译完成后,共310489token,Dogan Ural向Gemini 1.5 Pro提出了网友们关心的一系列问题,比如“在推特上扩大或者减少影响力的前5件事是什么?”
Gemini 1.5 Pro很轻松地给出了这样婶儿的答案:
![Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了:想要访问权限](/wp-content/uploads/replace/96e9989ae2f19a448a83e233817c35f3.jpeg)
你还见过哪些有趣的玩法?欢迎评论区分享~
参考链接:
[1]https://twitter.com/mckaywrigley/status/1762175776726663267
[2]https://twitter.com/mattshumer_/status/1759981272779108403?s=46&t=iTysI4vQLQqCNJjSmBODPw
— 完 —
- CPU、GPU的互连从1米飙至100米,英特尔:你相信光吗?2024-07-27
- Nature封面:AI训AI,越训越傻2024-07-27
- 打乱/跳过Transformer层会怎样?最新研究揭开其信息流动机制,一口气解答8大问题2024-07-26
- 谷歌AI拿下IMO银牌,仅差一分得金!第四题仅用时19秒2024-07-26