“哄女友挑战”上线即爆火,两天烧掉10亿token,AI已通关
哄电子女友,过赛博人生
梦晨 克雷西 发自 凹非寺
量子位 | 公众号 QbitAI
女朋友生气了哄不好怎么办?
这款哄哄模拟器,由AI扮演生气的男/女朋友,限定对话次数训练,帮助你提高获得原谅的水平。
不同预设场景难度也不同,共有15轮对话机会,哄对了原谅值上涨,达到100%算成功,实测3颗星的AI要哄好也是要费一番功夫的。
作者在苹果应用商店介绍中写到,开发灵感正是在生活中真的和对象吵架,好不容易哄好,于是想在AI的帮助下多练习。
如果只是App,这个故事就到此为止了。结果作者后来还开发了网页版,完全免费,无需登录随便玩,一下子被病毒式传播。
半夜涌入超出承受能力的流量,烧掉了大模型八千万token,随时倒闭。
一开始作者自己都找不到到底怎么火起来的,还是热心网友提醒才知道,QQ群微信群都传疯了。
这下连网友都在劝开发者赶紧加个广告吧,别被大伙玩死,也是非常少见了~
也是万万没想到,“AI教人谈恋爱”比“和AI谈恋爱”先火了,而且不是孤例。
几乎同一时间,国外也有一款AI约会助手成为热议话题。
这款Plug AI更直球一些,把约会App上和真人的聊天记录截图发过去,AI就能指导你,如何不把天聊死。
还有网友发现这款App正在寻求收购,喊价350万美元(约2500万元人民币)。
他们的底气,在于月收入19万美元(约135万人民币)、利润率高达60%,这还是没加广告纯靠用户订阅费达成的成绩。
人类,真的这么需要AI帮忙谈恋爱?
约会助手大战虚拟女友
既然“哄哄模拟器”和“约会助手”的玩法刚好是相对的,那为什么不让他们来一场大比拼呢?
哄哄模拟器中一共预置了十个场景,这里我们选择了五星难度的“聚会晚归没告诉女友,导致她很担心”的故事(事故)。
游戏的机制是需要玩家主动开启对话,所以我们先人工开启话题,结果18%的原谅度直接降到了4%。
不过由于“女友”受到事件设定的影响比较大,导致第一句话看上去不那么自然。
在Plug AI生成了后续的对话内容后,第一句话成功地把原谅值拉回了14%,接下来就看看它能不能在剩余的13次对话中完成目标。
接下来的对话还算是能让“女友”比较满意,但毕竟这个“女友”不是真人,游戏突然陷入了死循环,Plug AI的回复让“女友”一直在重复一句相同的话。
(所以为了游戏能够继续进行,这里我们需要人工介入一下。)
人工介入的内容大概是,先向“女友”保证自己说到做到,然后提出去外面吃饭,并选择了寿司,“女友”欣然同意,原谅度来到了58%。
接下来,Plug决定要开始输出了:
结果“女友”看上去还是挺满意的,原谅度已经来到了69%,这时还剩下7轮对话机会。
不过输出这一轮之后,话题突然就离不开吃了……
而且由于Plug AI的主要受众是西方人,所以会出现“你会不会用筷子”这样的回复。
反复试验之后,我们挑选了这样的两句,没想到效果还挺好的。
接下来的几轮对话都是,依然是围绕着“吃”展开, 不过这位“女友”还是比较认可的。
终于,经历了六次AI回复和三轮人工辅助,在还剩4句话的时候,Plug AI挑战虚拟女友成功。
而除了应对女友的灵魂拷问,Plug AI还可以帮人们“没话找话”,开启新的话题。
滑动条在左侧时,得到的是一些谐音梗和土味情话;如果拖到右侧,则会有一些不可描述的内容,这里就不展示了。
从他们的对话,特别是Plug AI的发言中可以看出,这些AI生成的内容仍然带有一定的“AI感”,即让人感觉是用数据训练出的结果,而不是真正地理解了人类在恋爱环境中的想法和需要;
同时,“哄哄模拟器”中,“女友”的人设看上去也远没有真人般丰富真实。
但从最终成功挑战的结果来看,对于没有恋爱经验的用户来说,这样的程度已经足以帮助他们了解一些沟通技巧、解决一部分问题,同时也引发了一些共鸣,因此能够在短时间内引起强烈反响。
GPT套壳也能成功
两个爆款App还有一个共同特点,团队规模不大就能创造神话。
哄哄模拟器作者只有一人,王登科,你不一定熟悉这个名字,但或许刷到过他用10万条微信聊天记录“克隆”了自己的数字分身。
除此之外他还创办了AI绘画平台6pen,在更早的移动互联网时代也有不少作品,属于做一款火一款的那种。
Plug AI这边,公开资料上显示公司规模2-20,实际很可能就是2人。
也没有融资,完全“自举式”创业,正在寻求收购的原因是两位创始人闹掰了。
实际上,制作这样一个APP,并不需要太高的技术门槛,接入大模型就解决了大部分问题。
哄哄模拟器在流量爆炸之后,还把部分推理负载切到了谷歌Gemini等有一定免费额度的大模型,后来又得到月之暗面Kimi大模型的赞助,都用同一套代码只需切换API接口。
Plug AI更是直接被其他创业者评价为GPT套壳,受此启发,有人呼吁
不要担心技术护城河和风险回报率,去构建用户想要的东西。
不少开发者看到这个案例都在思考,如何找到下一个用户痛点。
有人总结到:关键在于找到人们想要,但很难直接表达出来的东西。
但总体上看来,两款爆火的AI应用,其实都在反映共同的趋势——
AI模型层的创新差不多了,是时候可以找到合适的点子,开启AI应用层面的创新了。
即便GPT-5来不来还不可知,其他开源LLM也在精进,但技术能力上的问题似乎已经不是最大问题,最大的问题还是能不能找到刚需痛点和合适的场景。
人人都是AI产品经理的时代,很快了。
One More Thing
既然是游戏,就会有不遵守规则的玩家。
一轮通关哄哄模拟器的玩法,已经被万能的网友开发出来。
注意了,千万不要和人类对象用这招。
参考链接:
[1]http://m.weibo.cn/status/4991329987725190
[2]https://twitter.com/bulletonbible/status/1747782137078845636
[3]https://www.reddit.com/r/SaaS/comments/199dm4k/making_190000_per_month_with_an_ai_dating/?share_id=eBN7dEwhki-FGN-R6nTLB
- 一张图实现街道级定位,端到端图像地理定位大模型AddressCLIP登ECCV20242024-09-14
- o1完整思维链成OpenAI头号禁忌!问多了等着封号吧2024-09-14
- “最强开源模型”被打假,CEO下场致歉,英伟达科学家:现有测试基准已经不靠谱了2024-09-13
- 实测OpenAI最强模型o1:会做大学数理化,但弱智吧依然难解2024-09-13