Claude加速上新:基础版数学编程双提升,「幻觉」也更少,CEO:两三年内AI将成高知人类
Claude Instant推出1.2版
西风 发自 凹非寺
量子位 | 公众号 QbitAI
“ChatGPT最强竞品”Claude基础版上新——
更轻、更快、价格只要Claude 2六分之一的Claude Instant推出1.2版本。
在这次更新中,官方提到基础版Claude Instant吸纳了高性能型号Claude 2的优势,编码、数学能力经测试比原来提升近六个百分点。
是加量不加价的感觉了(手动狗头)。
![](/wp-content/uploads/replace/9a7c9d04e3f3a891f784cc23e26eccc5.gif)
目前,全新Claude Instant 1.2已可申请通过API部署,一起来康康都做了哪些更新。
更快,更便宜
具体来说,Claude Instant 1.2在编码、推理等方面的能力有所提升。不仅能生成更长、结构更好的回复,还能更好地遵循格式化指令,在引用提取、多语言能力和问答方面也有了一些改进。
![](/wp-content/uploads/replace/7f5ac376aa82b9f865572edf7e91f4dd.gif)
在Codex评估(编码性能测试)中,Claude Instant 1.2达到58.7%,而1.1版本为52.8%。
在GSM8K基准测试(数学能力测试)中,同样提高了近六个百分点,1.2版本得分为86.7%,1.1版本的得分为80.9%。
![](/wp-content/uploads/replace/298bb359b665babb7e95690e986f59c8.png)
△Claude Instant 1.1和1.2的性能比较
此外,Claude Instant 1.2还提高了安全性,产生“幻觉”更少,对“越狱”的抵抗力更强。
![](/wp-content/uploads/replace/5619d72fffcc7d3f01ea2b306764b58a.png)
△Claude不同模型安全性评估,越低越好
在上下文窗口长度上,Claude Instant 1.2与Claude 2相同,都是10万token,相当于75000个单词,差不多是一本《了不起的盖茨比》的长度。
再来看看买下这些功能要花多少钱,Claude Instant系列定价比Claude 2便宜,但都是分输入和输出两部分定价。
Claude Instant的Prompt定价是每100万token 1.63美元,Completion定价是每100万token 5.51美元:
![](/wp-content/uploads/replace/a85609309a1e2ff459420d2a73cebb29.png)
挑战OpenAI
Claude背后公司为Anthropic,想必大家也不陌生了。
Anthropic由OpenAI前研究副总裁Dario Amodei带头于2021年成立。
![](/wp-content/uploads/replace/ee964d9b7a60397502db003d8ed9d569.jpeg)
离开OpenAI时,Dario Amodei可谓带走了一批核心人才,这里面就包括GPT-3首席工程师Tom Brown,也有OpenAI安全和政策副总裁Daniela Amodei(Dario的姐姐)。
眼下,Anthropic曾表示目标是建立一个“前沿模型”,会比当今最强的AI再强10倍,并认为这是“AI自学的下一代算法”(next-gen algorithm for AI self-teaching)。这个前沿模型可用于构建虚拟助手,回复电子邮件,进行研究,生成艺术品、书籍等。
目前Anthropic已融资14.5亿美元,但这还远远不够,他们预计未来两年内需要50亿美元用于AI研发。
最近Dario Amodei也公开表示:
让模型像一个受过良好教育的人,可能离我们并不遥远,我认为在两三年内就有可能实现。
![](/wp-content/uploads/replace/6cb600a824da7e22ef2caec184f2d866.gif)
外媒TechCrunch认为,Anthropic现在推出新版Claude Instant是为了与OpenAI以及Cohere、AI21 Labs等初创公司提供的类似基础产品竞争。
Anthropic目前拥有众多客户和合作伙伴,其中就包括“美国知乎”Quora。
虽然,Claude Instant 1.2目前只有API版本,但在Quora旗下的Poe.com上大家可以免费试用Claude Instant。
参考链接:
[1]https://twitter.com/karinanguyen_/status/1689318903670063104
[2]https://twitter.com/_akhaliq/status/1689334269137543173
[3]https://techcrunch.com/2023/08/09/anthropic-launches-improved-version-of-its-entry-level-llm/
- 打乱/跳过Transformer层会怎样?最新研究揭开其信息流动机制,一口气解答8大问题2024-07-26
- 谷歌AI拿下IMO银牌,仅差一分得金!第四题仅用时19秒2024-07-26
- 港大马毅:大模型长期没有理论就像盲人摸象;大佬齐聚谈AI下一步2024-07-24
- 贾扬清共一论文获ICML时间检验奖:首个开源版AlexNet,著名框架Caffe前身,最佳论文奖也已公布2024-07-24