GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查
网友:呼叫旧版GPT-4
西风 发自 凹非寺
量子位 | 公众号 QbitAI
GPT-4再次遭网友“群攻”,原因是“懒”得离谱!
有网友想在Android系统开发一个能够与OpenAI API实时交互的应用。
于是把方法示例链接发给GPT-4,让它用Kotlin语言编写代码:
![GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查](/wp-content/uploads/replace/ee4955982573f4fbcc1b6a47a3c83f90.png)
没成想,和GPT-4一来二去沟通半天,GPT-4死活给不出一个能正常运行的完整代码。
反而解释了一通“应该怎么做”。
这让网友着实恼火,发推文吐槽“两周前能写好的代码,现在却不行了”。
![GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查](/wp-content/uploads/replace/c96945cf02a54803f0b7688e933532d6.png)
结果一下子炸出来更多网友:
终于有人调查这事儿了。
![GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查](/wp-content/uploads/replace/261f6dbb61964fec4d8c8347f8a43e37.png)
大伙儿连连表示遇到了类似问题:
![GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查](/wp-content/uploads/replace/0307c1adde563bf169d9328d34fc834c.png)
据网友所述,似乎从11月6日GPT-4大更新起,就开始出现这种情况了。
目前有OpenAI员工出面回应,表示已将问题反馈给团队。
只要代码,完整代码!
也难怪网友会“破防”,就说上面网友把方法示例链接发给GPT-4,让它用Kotlin语言编写代码之后。
GPT-4给出的回复是这样婶儿的,足足列了7条步骤,都在解释“应该怎么做”:
![GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查](/wp-content/uploads/replace/04bda992273192fe43083ee261d2a816.png)
直到最后才给出代码,但只是一个基础“模版”:
![GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查](/wp-content/uploads/replace/9540dea3641785d2a001a42606618e83.png)
网友起初还比较有耐心,告诉它“不需要解释,只要给我代码,完整的代码,能100%正常运行的代码”:
![GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查](/wp-content/uploads/replace/4691eff36b26ab134b7b61f4ee428062.png)
结果GPT-4张口又在解释、举例子:
![GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查](/wp-content/uploads/replace/2c01e7665e96a560660a3fd24fa5cfe8.png)
网友气不打一处来,直接打断它,并再次强调“不要解释,给我代码”:
![GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查](/wp-content/uploads/replace/29cf41c8eb4e041c9f925f8f82c93f9d.png)
GPT-4这下可是真真明白了,把上面那个模版稍微改动了一下,就发出来了:
![GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查](/wp-content/uploads/replace/ad906c35abf4d5aa4cf3fbd38ba5b89c.png)
这才有了开头的一幕,网友无奈发帖吐槽。
![GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查](/wp-content/uploads/replace/4ca64dee6cdd68cc8d7055e162ca5766.gif)
对于GPT-4的回复,网友“怒吼”了一句:他们都对你做了什么?抱歉你被削弱了。
![GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查](/wp-content/uploads/replace/1672bb4e7fc4300fc65bc0a868d80b24.png)
GPT-4此刻也是一脸无辜。
陆陆续续出来吐槽的网友中,更有甚者表示已经不用ChatGPT了。
![GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查](/wp-content/uploads/replace/7520e04f2c5f5331eda2b9c0d29c1083.png)
AI图像编辑器dingboard CEO@kache (yacine)在前一天也发帖吐槽,浏览量达157000+:
在过去的一个半星期里,我一直在编写“幼稚”的代码,因为GPT-4不那么遵循指令了。
![GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查](/wp-content/uploads/replace/79dd7ba8f6c73d717bc327d1adb9321a.png)
巧了不是,如果按网友所说的“一个半星期”来算,时间还和奥特曼·真还传事件吻合了。(手动狗头)
kache (yacine)还有一条帖子满满都是情绪,“请把旧的GPT-4还给我”:
![GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查](/wp-content/uploads/replace/ff343bfc8ed3114b017a7544196cad22.png)
这位网友表示“我懂你”:
以前它能做出很好的猜测,现在它会给我十个理由解释为什么它不能做出好的猜测。
上周,我对着聊天框大喊“f*ing do it!!”的次数创下历史新高。
![GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查](/wp-content/uploads/replace/839055367e17ec86edd2b26524a8a7f3.png)
一时间,GPT-4的“懒惰”成为众多网友“讨伐”对象。
沃顿商学院教授Ethan Mollick也看不下去了,亲自上手测试了一下,结果似乎表明这是真的。
![GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查](/wp-content/uploads/replace/af63481d0e9592a71c19632e97998379.png)
Ethan Mollick重复了一系列之前用代码解释器(Code Interpreter)做的分析。
![GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查](/wp-content/uploads/replace/f5e016b7d7ddc231aad8c15f244a3cb2.png)
GPT-4虽然知道该怎么做,但会一直提示“去完成工作”。导致原本的一个步骤变成了许多步骤,而且有些步骤很奇怪。
![GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查](/wp-content/uploads/replace/7182300b1edc714b02bb41d2cc7e83e3.png)
这下Ethan Mollick也是无语住了。
GPT-4到底是怎么了?背后原因还不得而知,网友们也是纷纷猜测起来。
OpenAI员工:已反馈给团队
Ethan Mollick还是很严谨,认为即便如此也不足以证明GPT-4变得越来越笨了,他推测这可能是系统负载过高的暂时问题。
![GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查](/wp-content/uploads/replace/bc2b283c892c539057a9e419cfeb7505.png)
如果你是在手机(移动设备)上遇到了这种问题,那可能是因为手机版系统提示的原因,会指示ChatGPT生成更简短精要的答案。
我的测试是在网页版进行的。
![GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查](/wp-content/uploads/replace/46afd4eb03caf4d18ef9e0451c8efa5a.png)
Reddit上也有人发文讨论,其中有一篇帖子指出“并不是新版GPT-4懒,只是我们用错了”:
![GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查](/wp-content/uploads/replace/4ed095bf4eb770aba47037b56400eab7.png)
文中指出,GPT-4自本月6号进行了一次大更新后,基础版本没有自定义提示,这就导致GPT-4没有预定义的“路径”来指导其行为。
这让它非常通用,但默认设置下它的输出也有些“无方向”。
解决办法之一,就是使用更新后提供的自定义GPT新功能(GPTs),为每项工作设置一个专门的GPT。
也相继有网友分享“小妙招”:
新版GPT-4改变游戏规则的一点是它能一次性解释的代码量。明确地说出类似“请完整地写出这个测试”的指令,可能会有用。
同时,明确指出“不要重写已经写过的代码”也很有帮助,这样可以节省token,让模型专注于产生新的输出。
我还发现,加入“一步一步思考”的提示会在开始时增加一些计划性的文本,这有助于后续输出更好地定位上下文。
![GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查](/wp-content/uploads/replace/78c02d2d9623bd0f9eb572607008d425.png)
但也有网友表示自己在用的时候,无论如何都会留下一些“待办事项”:
![GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查](/wp-content/uploads/replace/0ceb3b68d6c426b3a64e65bf55cda01c.png)
这位网友更是直言GPT-4现在像是得了老年痴呆:
OpenAI暗示的是新版GPT-4非常善于遵循指令,但事实并非如此。
我从一开始就一直在使用GPT-3、3.5再到后来的4,从未见过这种程度的阿尔茨海默症。
![GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查](/wp-content/uploads/replace/e90adb22ae9794a70df42d7f6db827cd.png)
在网友的激烈吐槽下,OpenAI员工也出面回应。
起初是让网友们提供一些具体的例子,说是研究一下,很有可能在下次模型版本迭代中修补这些问题。
![GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查](/wp-content/uploads/replace/eba7849fcb4ea02c07b5276781e250d4.png)
此话一出,炸出更多网友“上报故障”。
![GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查](/wp-content/uploads/replace/8ec2fc499482a2dd2eaa17fc713e300e.png)
will depue再次回应:
感谢反馈,在这里的所有示例都会帮助我们更快地解决这个问题。我刚刚将其转发给团队,后续有消息会及时通知。
![GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查](/wp-content/uploads/replace/3af2725afacf5242925cdcb15a47c5de.png)
看来官方后续回应还要再等一波,家人们最近有遇到类似情况吗?
参考链接:
[1]https://twitter.com/erhartford/status/1729566883350012038
[2]https://x.com/emollick/status/1729358803425001702?s=20
- 打乱/跳过Transformer层会怎样?最新研究揭开其信息流动机制,一口气解答8大问题2024-07-26
- 谷歌AI拿下IMO银牌,仅差一分得金!第四题仅用时19秒2024-07-26
- 港大马毅:大模型长期没有理论就像盲人摸象;大佬齐聚谈AI下一步2024-07-24
- 贾扬清共一论文获ICML时间检验奖:首个开源版AlexNet,著名框架Caffe前身,最佳论文奖也已公布2024-07-24