Claude加速上新:基础版数学编程双提升,「幻觉」也更少,CEO:两三年内AI将成高知人类

Claude Instant推出1.2版

西风 发自 凹非寺

量子位 | 公众号 QbitAI

“ChatGPT最强竞品”Claude基础版上新——

更轻、更快、价格只要Claude 2六分之一的Claude Instant推出1.2版本。

在这次更新中,官方提到基础版Claude Instant吸纳了高性能型号Claude 2的优势,编码、数学能力经测试比原来提升近六个百分点。

是加量不加价的感觉了(手动狗头)。

目前,全新Claude Instant 1.2已可申请通过API部署,一起来康康都做了哪些更新。

更快,更便宜

具体来说,Claude Instant 1.2在编码、推理等方面的能力有所提升。不仅能生成更长、结构更好的回复,还能更好地遵循格式化指令,在引用提取、多语言能力和问答方面也有了一些改进。

在Codex评估(编码性能测试)中,Claude Instant 1.2达到58.7%,而1.1版本为52.8%。

在GSM8K基准测试(数学能力测试)中,同样提高了近六个百分点,1.2版本得分为86.7%,1.1版本的得分为80.9%。

△Claude Instant 1.1和1.2的性能比较

此外,Claude Instant 1.2还提高了安全性,产生“幻觉”更少,对“越狱”的抵抗力更强。

△Claude不同模型安全性评估,越低越好

在上下文窗口长度上,Claude Instant 1.2与Claude 2相同,都是10万token,相当于75000个单词,差不多是一本《了不起的盖茨比》的长度。

再来看看买下这些功能要花多少钱,Claude Instant系列定价比Claude 2便宜,但都是分输入和输出两部分定价。

Claude Instant的Prompt定价是每100万token 1.63美元,Completion定价是每100万token 5.51美元:

挑战OpenAI

Claude背后公司为Anthropic,想必大家也不陌生了。

Anthropic由OpenAI前研究副总裁Dario Amodei带头于2021年成立。

离开OpenAI时,Dario Amodei可谓带走了一批核心人才,这里面就包括GPT-3首席工程师Tom Brown,也有OpenAI安全和政策副总裁Daniela Amodei(Dario的姐姐)。

眼下,Anthropic曾表示目标是建立一个“前沿模型”,会比当今最强的AI再强10倍,并认为这是“AI自学的下一代算法”(next-gen algorithm for AI self-teaching)。这个前沿模型可用于构建虚拟助手,回复电子邮件,进行研究,生成艺术品、书籍等。

目前Anthropic已融资14.5亿美元,但这还远远不够,他们预计未来两年内需要50亿美元用于AI研发。

最近Dario Amodei也公开表示:

让模型像一个受过良好教育的人,可能离我们并不遥远,我认为在两三年内就有可能实现。

外媒TechCrunch认为,Anthropic现在推出新版Claude Instant是为了与OpenAI以及Cohere、AI21 Labs等初创公司提供的类似基础产品竞争。

Anthropic目前拥有众多客户和合作伙伴,其中就包括“美国知乎”Quora。

虽然,Claude Instant 1.2目前只有API版本,但在Quora旗下的Poe.com上大家可以免费试用Claude Instant。

参考链接:
[1]https://twitter.com/karinanguyen_/status/1689318903670063104
[2]https://twitter.com/_akhaliq/status/1689334269137543173
[3]https://techcrunch.com/2023/08/09/anthropic-launches-improved-version-of-its-entry-level-llm/

版权所有,未经授权不得以任何形式转载及使用,违者必究。