Java基础、中级、高级、架构面试资料

Claude Sonnet 5 发布,Fable 5 和 Mythos 5 解禁

业余杂谈 herman 7浏览
公告:“业余草”微信公众号 AI 中转站提供免费体验,点击链接 https://unity2.ai/register?ref=3XTnndN2 进行访问,支持 Claude、ChatGPT、Gemini 等最新模型!关注业余草微信公众号,添加作者微信:xttblog2!
本博客日IP超过2000,PV 3000 左右,急需赞助商。
极客时间所有课程通过我的二维码购买后返现24元微信红包,请加博主新的微信号:xttblog2,之前的微信号好友位已满,备注:返现
受密码保护的文章请关注“业余草”公众号,回复关键字“0”获得密码
所有面试题(java、前端、数据库、springboot等)一网打尽,请关注文末小程序
视频教程免费领
【腾讯云】1核2G5M轻量应用服务器50元首年,高性价比,助您轻松上云

AI 圈流传着一句梗,只要你学的慢,就可以不用学。因为半年后,可能就淘汰了。

你看年初的 OpenClaw 类龙虾产品,现在没啥热度了。对应的模型厂商变化也很快,以 Claude 发布的 sonnet 等模型为例,版本升级太快,半年前的模型半年后就下线了。

距离上次 Claude 发布 Fable 5 没多久,Claude Sonnet 5 就突袭发布了。它的发布,即使应对 ChatGPT 5.6 的冲击,更是面对 Claude Fable 5 和 Mythos 5 被禁用的困境突破,这背后的一切都是 AI 大厂博弈的结果。所以,接下来,我们就一起来看看 Claude Sonnet 5 本次发布带来了哪些惊喜。

文章配图参见 https://mp.weixin.qq.com/s/uzkfwwX640Cg4aJwNcuhsA

Claude Sonnet 5 正式发布

就在刚刚过去的 6 月 30 日,Anthropic 毫无预兆地扔出了一枚重磅炸弹 Claude Sonnet 5,代号为 Fennec,耳廓狐。这款被官方定义为“史上最具 Agent 能力的 Sonnet 模型”,没有走 Opus 的旗舰路线,而是直接把原本属于顶级模型的能力,下放到了大众可用的价格带。

这意味着什么?

要知道几个月前,我们还需要花大价钱调用 Opus 级别模型才能实现的自主规划、浏览器操控、终端工具调用,现在 Sonnet 5 就能搞定,而且今天起,全球所有 Free 和 Pro 用户都能直接用

核心亮点速览

根据 Claude 的官方博客可知,它有以下核心亮点。

维度Sonnet 5 规格
模型定位Sonnet 4.6 的 drop-in 升级,Agent 能力最强 Sonnet
上下文窗口100 万 token
最大输出128K
推理模式默认启用 adaptive thinking,支持 low/medium/high/xhigh 四档
推广期价格输入 $2/百万 token,输出 $10/百万 token(至8月31日)
标准价格输入 $3/百万 token,输出 $15/百万 token

需要特别注意是,Sonnet 5 采用了与 Opus 4.7 相同的新 tokenizer,同样一段文字可能比 Sonnet 4.6 多出 1.0-1.35 倍的 token 数。虽然单看标价和 4.6 同级,但实际账单需要重新测算。也就是说,Sonnet 5 可能没有大家相信中的便宜。

Sonnet 5 的 benchmark 有多猛?

对比 benchmark 可知,Anthropic 这次不是小修小补,而是直接把 Sonnet 的能力边界推到了 Opus 的门口。

关键 benchmark 对比

测试项Sonnet 5Sonnet 4.6Opus 4.8GPT-5.5
SWE-bench Pro(编程)63.2%58.1%69.2%58.6%
Terminal-Bench 2.180.4%67.0%82.7%
HLE(带工具)57.4%57.9%52.2%
OSWorld-Verified(电脑操控)81.2%83.4%78.7%
GDPval-AA v2(知识工作)1618 分1615 分

有几个值得品味的细节,我们单独来看看。

  1. 编程能力反超 GPT-5.5:Sonnet 5 在 SWE-bench Pro 上拿下 63.2%,直接把 GPT-5.5 的 58.6% 甩在身后。虽然距离 Opus 4.8 的 69.2% 还有差距,但别忘了 Sonnet 的价格只有 Opus 的 60%。
  2. 人类最后的考试“几乎打平”:在跨学科推理基准 Humanity’s Last Exam 上,Sonnet 5 带工具得分 57.4%,与 Opus 4.8 的 57.9% 仅差 0.5 个百分点。
  3. 知识工作意外反超:GDPval-AA v2 上 Sonnet 5 拿到 1618 分,竟然反超了 Opus 4.8 的 1615 分
  4. Terminal-Bench 暴涨 13 个百分点:从 Sonnet 4.6 的 67.0% 飙升至 80.4%,距离 Opus 4.8 的 82.7% 只差不到 2 个点。

以至于,社区开发者的评价都很直接,这是“最强打工 AI”。不是最强模型,但是最适合每天干活、性价比最高的那个。

Fable 5 与 Mythos 5 全面解禁

如果说 Sonnet 5 的发布是 Anthropic 的“阳谋”,那么 Fable 5 和 Mythos 5 的遭遇就是一场意外的“国家安全真人秀”。它们竟然也毫无意外的突然解禁了。

事件时间线

下面我们一起来回顾一下 Fable 5 与 Mythos 5 的时间线。

  • 6 月 9 日:Anthropic 发布 Claude Fable 5 和 Mythos 5,号称“史上最强、最安全的 Claude 模型”。Fable 5 面向公众开放,Mythos 5 通过 Project Glasswing 受限开放。
  • 6 月 12 日:美国商务部发出出口管制令,以国家安全为由,要求 Anthropic 立即切断所有外国公民对两款模型的访问,包括 Anthropic 自己的外籍员工。
  • 6 月 13 日:Anthropic 全球下线 Fable 5 和 Mythos 5,启动退款。Fable 5 的公开寿命,不足 96 小时。
  • 6 月 26 日:美国商务部部分解除 Mythos 5 限制,允许向“可信”的美国企业和政府机构开放。
  • 6 月 30 日(当地时间):美国商务部正式发函,宣布全面解除对 Fable 5 和 Mythos 5 的出口限制
  • 7 月 1 日:Anthropic 确认恢复访问。

背后的博弈

这次禁令的导火索,据多家媒体报道,是因为亚马逊安全团队向白宫提交的一份越狱报告,演示了如何突破 Fable 5 的安全防护,获取高危攻击代码。Anthropic 自己标榜的“行业最严三层安全防护”在上线不到 3 天就被攻破,恰逢美国政府想要收紧 AI 监管的节点,直接撞上了枪口。

更戏剧性的是,英国首相斯塔默曾亲自向白宫求情,希望为英国国民和企业争取豁免,结果被特朗普政府高级官员回绝,即使对 G7 盟友,这也完全不合逻辑。

此次解禁的条件是 Anthropic 与商务部就“加强安全防护措施”达成妥协。但业内普遍认为,这释放了一个明确信号,前沿 AI 模型已成为国家战略资产,“先发布、后补安全”的时代结束了。

Sonnet 5 vs Opus 4.8 vs Fable 5

现在 Claude 有了这么多模型,该怎么选呢?

可以看到,Claude 家族形成了清晰的四层梯队。

层级代表模型价格(标准)适用场景
轻量Haiku 4.5$1/$5实时响应、批量简单任务
均衡Sonnet 5$3/$15日常开发、Agent 工作流、知识工作
旗舰Opus 4.8$5/$25长自主任务、高精度代码审查、复杂架构设计
顶级Fable 5 / Mythos 5$10/$50最难推理、高风险高 stakes 任务

社区大佬给出的选型建议是:

  • 默认用 Sonnet 5:对于 80% 的生产环境工作,Sonnet 5 的性能已经足够接近 Opus 4.8,但成本低 40%-60%。
  • 升级 Opus 4.8 的场景:多文件深度重构、需要运行数小时的 Agent 任务、错误代价极高的关键代码审查。
  • Fable 5 的局限:虽然能力最强,但价格是 Sonnet 5 的 3 倍以上,且安全分类器会在网络攻防、生化、模型蒸馏等高风险领域自动回退到 Opus 4.8。对绝大多数开发者来说,Fable 5 的边际收益远不及成本增幅。
  • Mythos 5 的现实:仍主要通过 Project Glasswing 向网络安全防御者等特定机构受限开放,普通开发者和企业用户基本触达不到。

Fable 5 解禁了,普通用户能用吗?

简单来说,能用,但有前提。

根据 Anthropic 在 X 平台的确认,Fable 5 的访问权限已于 7 月 1 日起恢复。但此次解禁伴随着更严格的合规要求:

  1. 强制实名验证:据行业消息,Fable 5 回归后极大概率要求强制实名验证。
  2. 地域限制:虽然禁令解除,但“美国用户优先”的隐性门槛可能存在,海外用户的实际体验仍需观察。
  3. 算力配给:Anthropic 此前曾提示,6 月 23 日后 Fable 5 可能根据算力情况按量提供,不保证直接包含在基础订阅中。

相比之下,Sonnet 5 是“毫无保留”的全球开放,不需要等解禁、不需要特殊申请,今天就能在 Claude Code、Claude Platform 和 API 上直接调用。

结语

虽然 Claude Sonnet 5 发布了,标志着 Anthropic 正在重新调整产品策略,不再把最酷的能力只留给最贵的模型,而是让“中杯”也能干“大杯”的活。这对开发者也是利好,我们不需要为日常任务支付旗舰溢价。但是,最近 Claude 封号太 bug 了,朋友圈好多网友,哎,GLM 5.2 挺好的了。

同时,Fable 5 的禁令风波也提醒我们,AI 的能力越强,它离“普通商品”就越远,离“国家战略资产”就越近。在这个背景下,Sonnet 5 的全球无障碍开放,或许比它的 benchmark 分数更有意义。

智谱 GLM 5.2 真的挺强的,毕竟能稳定用上的 AI,才是好 AI

业余草公众号

最后,欢迎关注我的个人微信公众号:业余草(yyucao)!可加作者微信号:xttblog2。备注:“1”,添加博主微信拉你进微信群。备注错误不会同意好友申请。再次感谢您的关注!后续有精彩内容会第一时间发给您!原创文章投稿请发送至532009913@qq.com邮箱。商务合作也可添加作者微信进行联系!

本文原文出处:业余草: » Claude Sonnet 5 发布,Fable 5 和 Mythos 5 解禁