本博客日IP超过2000,PV 3000 左右,急需赞助商。
极客时间所有课程通过我的二维码购买后返现24元微信红包,请加博主新的微信号:xttblog2,之前的微信号好友位已满,备注:返现
受密码保护的文章请关注“业余草”公众号,回复关键字“0”获得密码
所有面试题(java、前端、数据库、springboot等)一网打尽,请关注文末小程序
【腾讯云】1核2G5M轻量应用服务器50元首年,高性价比,助您轻松上云
AI 圈流传着一句梗,只要你学的慢,就可以不用学。因为半年后,可能就淘汰了。
你看年初的 OpenClaw 类龙虾产品,现在没啥热度了。对应的模型厂商变化也很快,以 Claude 发布的 sonnet 等模型为例,版本升级太快,半年前的模型半年后就下线了。
距离上次 Claude 发布 Fable 5 没多久,Claude Sonnet 5 就突袭发布了。它的发布,即使应对 ChatGPT 5.6 的冲击,更是面对 Claude Fable 5 和 Mythos 5 被禁用的困境突破,这背后的一切都是 AI 大厂博弈的结果。所以,接下来,我们就一起来看看 Claude Sonnet 5 本次发布带来了哪些惊喜。
文章配图参见 https://mp.weixin.qq.com/s/uzkfwwX640Cg4aJwNcuhsA。
Claude Sonnet 5 正式发布
就在刚刚过去的 6 月 30 日,Anthropic 毫无预兆地扔出了一枚重磅炸弹 Claude Sonnet 5,代号为 Fennec,耳廓狐。这款被官方定义为“史上最具 Agent 能力的 Sonnet 模型”,没有走 Opus 的旗舰路线,而是直接把原本属于顶级模型的能力,下放到了大众可用的价格带。
这意味着什么?
要知道几个月前,我们还需要花大价钱调用 Opus 级别模型才能实现的自主规划、浏览器操控、终端工具调用,现在 Sonnet 5 就能搞定,而且今天起,全球所有 Free 和 Pro 用户都能直接用。
核心亮点速览
根据 Claude 的官方博客可知,它有以下核心亮点。
| 维度 | Sonnet 5 规格 |
|---|---|
| 模型定位 | Sonnet 4.6 的 drop-in 升级,Agent 能力最强 Sonnet |
| 上下文窗口 | 100 万 token |
| 最大输出 | 128K |
| 推理模式 | 默认启用 adaptive thinking,支持 low/medium/high/xhigh 四档 |
| 推广期价格 | 输入 $2/百万 token,输出 $10/百万 token(至8月31日) |
| 标准价格 | 输入 $3/百万 token,输出 $15/百万 token |
需要特别注意是,Sonnet 5 采用了与 Opus 4.7 相同的新 tokenizer,同样一段文字可能比 Sonnet 4.6 多出 1.0-1.35 倍的 token 数。虽然单看标价和 4.6 同级,但实际账单需要重新测算。也就是说,Sonnet 5 可能没有大家相信中的便宜。
Sonnet 5 的 benchmark 有多猛?
对比 benchmark 可知,Anthropic 这次不是小修小补,而是直接把 Sonnet 的能力边界推到了 Opus 的门口。
关键 benchmark 对比
| 测试项 | Sonnet 5 | Sonnet 4.6 | Opus 4.8 | GPT-5.5 |
|---|---|---|---|---|
| SWE-bench Pro(编程) | 63.2% | 58.1% | 69.2% | 58.6% |
| Terminal-Bench 2.1 | 80.4% | 67.0% | 82.7% | – |
| HLE(带工具) | 57.4% | – | 57.9% | 52.2% |
| OSWorld-Verified(电脑操控) | 81.2% | – | 83.4% | 78.7% |
| GDPval-AA v2(知识工作) | 1618 分 | – | 1615 分 | – |
有几个值得品味的细节,我们单独来看看。
- 编程能力反超 GPT-5.5:Sonnet 5 在 SWE-bench Pro 上拿下 63.2%,直接把 GPT-5.5 的 58.6% 甩在身后。虽然距离 Opus 4.8 的 69.2% 还有差距,但别忘了 Sonnet 的价格只有 Opus 的 60%。
- 人类最后的考试“几乎打平”:在跨学科推理基准 Humanity’s Last Exam 上,Sonnet 5 带工具得分 57.4%,与 Opus 4.8 的 57.9% 仅差 0.5 个百分点。
- 知识工作意外反超:GDPval-AA v2 上 Sonnet 5 拿到 1618 分,竟然
反超了 Opus 4.8 的 1615 分。 - Terminal-Bench 暴涨 13 个百分点:从 Sonnet 4.6 的 67.0% 飙升至 80.4%,距离 Opus 4.8 的 82.7% 只差不到 2 个点。
以至于,社区开发者的评价都很直接,这是“最强打工 AI”。不是最强模型,但是最适合每天干活、性价比最高的那个。
Fable 5 与 Mythos 5 全面解禁
如果说 Sonnet 5 的发布是 Anthropic 的“阳谋”,那么 Fable 5 和 Mythos 5 的遭遇就是一场意外的“国家安全真人秀”。它们竟然也毫无意外的突然解禁了。
事件时间线
下面我们一起来回顾一下 Fable 5 与 Mythos 5 的时间线。
- 6 月 9 日:Anthropic 发布 Claude Fable 5 和 Mythos 5,号称“史上最强、最安全的 Claude 模型”。Fable 5 面向公众开放,Mythos 5 通过 Project Glasswing 受限开放。
- 6 月 12 日:美国商务部发出出口管制令,以国家安全为由,要求 Anthropic 立即切断所有外国公民对两款模型的访问,包括 Anthropic 自己的外籍员工。
- 6 月 13 日:Anthropic 全球下线 Fable 5 和 Mythos 5,启动退款。Fable 5 的公开寿命,不足 96 小时。
- 6 月 26 日:美国商务部部分解除 Mythos 5 限制,允许向“可信”的美国企业和政府机构开放。
- 6 月 30 日(当地时间):美国商务部正式发函,宣布
全面解除对 Fable 5 和 Mythos 5 的出口限制。 - 7 月 1 日:Anthropic 确认恢复访问。
背后的博弈
这次禁令的导火索,据多家媒体报道,是因为亚马逊安全团队向白宫提交的一份越狱报告,演示了如何突破 Fable 5 的安全防护,获取高危攻击代码。Anthropic 自己标榜的“行业最严三层安全防护”在上线不到 3 天就被攻破,恰逢美国政府想要收紧 AI 监管的节点,直接撞上了枪口。
更戏剧性的是,英国首相斯塔默曾亲自向白宫求情,希望为英国国民和企业争取豁免,结果被特朗普政府高级官员回绝,即使对 G7 盟友,这也完全不合逻辑。
此次解禁的条件是 Anthropic 与商务部就“加强安全防护措施”达成妥协。但业内普遍认为,这释放了一个明确信号,前沿 AI 模型已成为国家战略资产,“先发布、后补安全”的时代结束了。
Sonnet 5 vs Opus 4.8 vs Fable 5
现在 Claude 有了这么多模型,该怎么选呢?
可以看到,Claude 家族形成了清晰的四层梯队。
| 层级 | 代表模型 | 价格(标准) | 适用场景 |
|---|---|---|---|
| 轻量 | Haiku 4.5 | $1/$5 | 实时响应、批量简单任务 |
| 均衡 | Sonnet 5 | $3/$15 | 日常开发、Agent 工作流、知识工作 |
| 旗舰 | Opus 4.8 | $5/$25 | 长自主任务、高精度代码审查、复杂架构设计 |
| 顶级 | Fable 5 / Mythos 5 | $10/$50 | 最难推理、高风险高 stakes 任务 |
社区大佬给出的选型建议是:
- 默认用 Sonnet 5:对于 80% 的生产环境工作,Sonnet 5 的性能已经足够接近 Opus 4.8,但成本低 40%-60%。
- 升级 Opus 4.8 的场景:多文件深度重构、需要运行数小时的 Agent 任务、错误代价极高的关键代码审查。
- Fable 5 的局限:虽然能力最强,但价格是 Sonnet 5 的 3 倍以上,且安全分类器会在网络攻防、生化、模型蒸馏等高风险领域自动回退到 Opus 4.8。对绝大多数开发者来说,Fable 5 的边际收益远不及成本增幅。
- Mythos 5 的现实:仍主要通过 Project Glasswing 向网络安全防御者等特定机构受限开放,普通开发者和企业用户基本触达不到。
Fable 5 解禁了,普通用户能用吗?
简单来说,能用,但有前提。
根据 Anthropic 在 X 平台的确认,Fable 5 的访问权限已于 7 月 1 日起恢复。但此次解禁伴随着更严格的合规要求:
- 强制实名验证:据行业消息,Fable 5 回归后极大概率要求强制实名验证。
- 地域限制:虽然禁令解除,但“美国用户优先”的隐性门槛可能存在,海外用户的实际体验仍需观察。
- 算力配给:Anthropic 此前曾提示,6 月 23 日后 Fable 5 可能根据算力情况按量提供,不保证直接包含在基础订阅中。
相比之下,Sonnet 5 是“毫无保留”的全球开放,不需要等解禁、不需要特殊申请,今天就能在 Claude Code、Claude Platform 和 API 上直接调用。
结语
虽然 Claude Sonnet 5 发布了,标志着 Anthropic 正在重新调整产品策略,不再把最酷的能力只留给最贵的模型,而是让“中杯”也能干“大杯”的活。这对开发者也是利好,我们不需要为日常任务支付旗舰溢价。但是,最近 Claude 封号太 bug 了,朋友圈好多网友,哎,GLM 5.2 挺好的了。
同时,Fable 5 的禁令风波也提醒我们,AI 的能力越强,它离“普通商品”就越远,离“国家战略资产”就越近。在这个背景下,Sonnet 5 的全球无障碍开放,或许比它的 benchmark 分数更有意义。
智谱 GLM 5.2 真的挺强的,毕竟能稳定用上的 AI,才是好 AI。

最后,欢迎关注我的个人微信公众号:业余草(yyucao)!可加作者微信号:xttblog2。备注:“1”,添加博主微信拉你进微信群。备注错误不会同意好友申请。再次感谢您的关注!后续有精彩内容会第一时间发给您!原创文章投稿请发送至532009913@qq.com邮箱。商务合作也可添加作者微信进行联系!
本文原文出处:业余草: » Claude Sonnet 5 发布,Fable 5 和 Mythos 5 解禁