

就在刚刚,Anthropic 发布了 Claude Haiku 4.5。
先通俗科普一下,Claude 家眷有三个不同参数目级的模子:Claude Opus(大杯)、Sonnet(中杯)和 Haiku(小杯)。
此次更新最大的看点是,小杯 Claude Haiku 4.5 在模子性能保抓高水准的同期,速率更快、价钱更低廉了。
五个月前,Claude Sonnet 4 如故最先进的模子之一。当前新出的 Haiku 4.5 在编码性能上险些和它打平手,但价钱惟有三分之一,速率还翻了两倍多。

▲ Chart comparing frontier models on SWE-bench Verified which measures performance on real-world coding tasks
具体来说,在用于忖度 AI 编码智商的测试集 SWE-bench Verified 上,Haiku 4.5 获得了 73% 的收货,什么见识?平直跟 Claude Sonnet 4 以及 OpenAI 最新的 GPT-5 站在归并水平线上。
在某些任务比如操控电脑方面,Haiku 4.5 致使反杀了老年老 Sonnet 4。
关于需要 AI 惩处及时、低蔓延任务的场景——比如聊天佑手、客服代理或结对编程助手,Haiku 4.5 兼具高智能和出色速率,能带来更好的体验。
使用 Claude Code 的建造者也会发现,Haiku 4.5 让通盘编程经由——从多智能体互助到快速原型建造——都变得更智慧高效。
天然,两周前发的 Sonnet 4.5 也曾是 Anthropic 的旗舰模子,包摄大家编程模子第一层次。但 Haiku 4.5 提供了另一个选项:性能接近顶配,价钱却亲民得多。
并且模子玩法更野了,Sonnet 4.5 不错把复杂问题拆成 N 个小任务,然后引导一堆 Haiku 4.5 并行开工,这配合出奇瓦解。
Anthropic 对 Haiku 4.5 进行了顾惜的安全性和对皆性测试。
效用表示,该模子的不良动作发生率较低,且比前代 Haiku 3.5 的对皆性权贵提高。在自动化对皆评估中,Haiku 4.5 的总体偏离动作比 Sonnet 4.5 和 Opus 4.1 都更少。
也便是说,它当前是 Anthropic 家最安全的模子。

▲ Comparison table of frontier models across popular benchmarks
至于价钱嘛 ...Haiku 4.5 的订价为:每百万输入 token 1 好意思元,每百万输出 token 5 好意思元。
对比来看,GPT-5 mini 约为每百万输入 0.25 好意思元、输出 2.5 好意思元,Google 的 Gemini 2.5 Flash 价钱差未几。也便是说,Haiku 4.5 的价钱冒失是 GPT-5 mini 或 Flash 的 4 倍。
不外跟 Sonnet 4.5 比,它低廉了约三倍,性能却险些没差,这对建造者来说算是降本增效了。
但有一说一,数学不是它的坚定。
有名博主 Dan Shipper 试用后发现,Haiku 在算术上有点 ... 蒙胧。
比如在测试 Uber 账单的例子里,Haiku 诚然完好找出了通盘联系邮件,但算总和时平直翻车。更烦懑的是,指出造作后它承认了——然后归来又犯了通常的错
Dan Shipper 给出的中肯评价是:
要是你是建造者或创业者,正在用 Sonnet 4.5 构建复杂的智能代理愚弄,当前不错议论切换到 Haiku。你能检朴多半资本,而性能亏损险些不错忽略。
要是你当前使用的是 Gemini 2.5 Flash 或 GPT-5 mini,提倡试试 Haiku。诚然价钱更高一些,但在需要调用器用和保抓自主性的场景中,它的进展更好。

▲附上博客地址:
https://every.to/vibe-check/vibe-check-claude-haiku-4-5-anthropic-cooked
当前,Claude Haiku 4.5 现已在 Claude Code 和万般愚弄中上线了。
建造者不错通过 Claude API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 使用 Haiku 4.5,平直替代 Haiku 3.5 和 Sonnet 4,并且价钱是 Anthropic 最香的那档。

咱们参考 @zb1992 的领导词,让 Claude 4.5 Haiku 跑了一个钟表 Demo,合座体验下来,代码生成速率照实更快了,最终制品也令东谈主欢快。
不才文这个经典的推理计议题, Claude 4.5 Haiku 反映速率上风就更明显了,天然,这也恰是轻量级模子在本色愚弄中的中枢竞争力场地。

另外,据 The Information 报谈,估值高达 1700 亿好意思元的 Anthropic 近几周已告诉投行照顾人,筹备通过收购引入更多时间东谈主才,同期拓展除编程助手除外的智商——毕竟当前编程这块如故营收大头。

知情东谈主士暗意,鉴于 Anthropic 在向建造者提供编程类 AI 居品方面获得的奏凯,公司下一步可能会推广至其他建造者常用的软件器用,比如自动测试代码轻佻的器用,或赞成软件瞎想的器用。
另有音问称,Anthropic 也可能通过收购建造面向特定行业的居品,举例金融办事、医疗保健或网罗安全,不外他们更倾向于交往金额在 5 亿好意思元以下的袖珍收购情状。
当前看起来,在升迁模子智商的同期,Anthropic 也在积极布局生态。AI 圈的你追我赶,最终受益的如故建造者和用户——更强的模子、更低的价钱、更多的遴荐。
作家:莫崇宇开云kaiyun官方网站