本博客日IP超过2000,PV 3000 左右,急需赞助商。
极客时间所有课程通过我的二维码购买后返现24元微信红包,请加博主新的微信号:xttblog2,之前的微信号好友位已满,备注:返现
受密码保护的文章请关注“业余草”公众号,回复关键字“0”获得密码
所有面试题(java、前端、数据库、springboot等)一网打尽,请关注文末小程序
【腾讯云】1核2G5M轻量应用服务器50元首年,高性价比,助您轻松上云
我其实一直是 Claude 的重度用户,但是最近一个月它的算力吃紧,限速和用量限制很严重。总是会遇到 5 个小时的限制,甚至最长的一次限制我了 3 天。后来,随着 gpt-image-2 以及 chatgpt 5.5 的发布,我也用上了 codex。现在是两个切换着用。
我之前预估,以后的算力可能会更紧张,谁知今早起床看到 Claude 发了一个爆炸消息。它的算力松绑了,从限流切换到了太空 AI 基础设施的豪赌。
接下来,我们一起来看看,这期间究竟发生了什么。
文章配图参见 https://mp.weixin.qq.com/s/16Mg7-pXG8DT5e3yyydFcA。
三项松绑,即刻生效
当地时间 5 月 6 日,Claude 母公司 Anthropic 在其年度开发者大会“Code with Claude”上扔下一枚重磅炸弹,与 SpaceX 达成算力合作协议,同时宣布三项用户侧政策调整,全部即时生效。
- Claude Code 5 小时速率限制翻倍。覆盖Pro($20/月)、Max 5x($100/月)、Max 20x($200/月)及Team计划;
- 取消 Pro 与 Max 账户的“高峰时段限流”。此前太平洋时间工作日早 5 点至 11 点的限速窗口永久关闭;
- 大幅提高 Claude Opus 模型的 API 速率限制,开发者获得显著更高的调用配额。
这三项调整并非孤立的技术优化,而是 Anthropic 近半年“算力焦虑”的一次集中释放。要理解今天的“松绑”,必须回溯过去 8 个月那条不断收紧又突然松开的算力绳索。
算力吃紧时间线
接下来,我们来回顾一下 Claude 的算力吃紧时间线,从隐性约束到显性限流。
2025 年 8 月
首先是每周上限的首次锁紧。
Anthropic 的算力管控并非始于今日。早在2025 年 8 月 28 日,公司就宣布对 Pro 和 Max 用户引入每周使用上限,官方理由是打击账号共享与转售,声称“预计影响不到 5% 的订阅者”。
这是 Anthropic 首次对高付费用户设置硬性周度天花板,标志着其基础设施开始与用户需求产生摩擦。
2026 年 2 月
2 月 12 日,Anthropic 宣布完成300 亿美元 G 轮融资,投后估值 380 亿美元,由新加坡 GIC 和 Coatue 领投。
几乎在同一时刻,Elon Musk 在 X 上向 Anthropic 开火,也就是网传的马斯克开炮与 300 亿美元融资事件。称其 AI “厌人类且邪恶”(misanthropic and evil),嘲讽公司名“Anthropic”(亲人类)注定沦为“Misanthropic”(厌人类)。
这场口水战背后,是 xAI 与 Anthropic 在 AI 安全理念上的深层分歧,也为三个月后两家公司的“握手”埋下了戏剧性的伏笔。
2026 年 3 月 26 日
今年 3 月 26 日,Anthropic 工程师 Thariq Shihipar 在 X 上宣布,工作日太平洋时间早 5 点至 11 点(北京时间晚 9 点至次日凌晨 3 点),Claude Code 的五小时会话限制将显著降低。这是对高峰时段的限流,也是压垮开发者的最后一根稻草。
这一时段恰好覆盖美国和欧洲开发者最核心的编码时段。据官方统计,约7% 的用户开始遭遇此前从未见过的会话限制,Pro 用户受影响尤为严重。
开发者社区瞬间炸锅。Reddit 和 Discord 上充斥着抱怨。有 Pro 用户称“一个月 30 天,实际只能用 12 天”;Max 5x 用户称“1 小时就用完原本 8 小时的配额”。
随后的 3 月 31 日,Anthropic 官方紧急承认,“用户触及 Claude Code 使用上限的速度远超预期,这是团队的头等大事”。
2026 年 4 月
就在限流风波未平之际,一场更隐蔽的技术危机爆发。
4 月中旬,开发者通过 HTTP 代理逆向工程发现,Claude Code v2.1.100 版本存在服务器端 Token 通胀 Bug。在相同请求下,v2.1.100 比 v2.1.98 少发送 978 字节,却多计费 20196 个 Token,整体配额消耗速度加快约40%。这也是网上讨论热烈的 Token 通胀 Bug 与“幽灵配额”事件。
这些“幽灵 Token”不仅烧钱,还会挤占模型的上下文窗口,导致用户自定义的 CLAUDE.md 指令被稀释,输出质量下降。
社区将此事戏称为“Tokenocalypse”。截至 5 月初,Anthropic 仍未发布公开修复补丁,临时解决方案是降级至 v2.1.98 或通过 npm 重装。
4 月 16 日,Anthropic 发布 Opus 4.7,新 Tokenizer 导致相同输入文本生成 Token 数增加高达35%,进一步加剧配额消耗。
4 月 22 日,Anthropic 一度在 Pro 计划定价页面移除 Claude Code 入口,引发社区强烈反弹后紧急撤回。
至此,Anthropic 的算力危机已从后台基础设施问题,演变为前台信任危机。
SpaceX 入局
5 月 6 日的官宣,22 万颗 GPU 的“天降神兵”为这场持续半年的算力困局提供了物理层面的终结方案。
根据 Anthropic 官方博客,公司与 SpaceX 签署协议,获得 SpaceX 位于田纳西州孟菲斯市的 Colossus 1 数据中心全部算力使用权。
这座数据中心的核心参数堪称恐怖。
- 超过 300 兆瓦电力容量
- 超过 220000 颗 NVIDIA GPU,包括密集部署的 H100、H200 及下一代 GB200 加速器
- 全部容量将在一个月内上线可用
Colossus 1 原本是马斯克旗下 xAI 为训练 Grok 模型而建造的超级计算机,号称“全球最大且部署最快的 AI 超算之一”,仅用 122 天就建成。
更具戏剧性的是,今年 2 月 SpaceX 已完成与 xAI 的合并,合并后实体估值高达1.25 万亿美元。
这意味着,Anthropic 现在正租用其直接竞争对手的基础设施。
马斯克的态度反转
就在合作协议宣布当日,Musk 在 X 上的表态与两个月前的“厌人类”指控形成鲜明对比。
上周我花了很多时间与 Anthropic 高级团队成员交流,了解他们如何确保 Claude 对人类有益,印象深刻。我遇到的每个人都非常能干,非常关心做正确的事。没有人触发我的邪恶探测器。只要他们保持批判性自我审视,Claude 应该会很好。
他甚至补充了一句充满马斯克式威胁的“善意”。“如果他们的 AI 做出危害人类的行为,我们保留收回算力的权利”。
另据 Wired 报道,Musk 解释此次合作的原因是“SpaceXAI 已将训练工作迁移至 Colossus 2”,因此 Colossus 1 的闲置容量可以出租。
太空算力
合作协议中最令人瞠目的条款,并非当下的 22 万颗 GPU,而是从地面豪赌到轨道幻想,Anthropic 表达了与 SpaceX 合作开发数吉瓦(gigawatts)级轨道 AI 算力容量的兴趣。
SpaceX 近期已向 FCC 提交文件,计划发射一百万颗卫星以构建轨道数据中心。
SpaceX 在官方声明中称,“训练和运行下一代 AI 系统所需的算力,正在超越地球在关键时间线上所能提供的电力、土地和冷却能力。轨道数据中心可以提供近乎无限的可持续能源,且对地球环境影响更小”。
这一构想目前仍停留在意向阶段,但其象征意义远超技术可行性。当 AI 算力需求开始指向太空,说明地面基础设施的扩张速度已无法满足模型迭代的指数级消耗。
Anthropic 的算力版图
SpaceX 协议只是 Anthropic 算力扩张版图的最新一块拼图。过去数月,该公司已签署一系列超大规模基础设施协议,开启了一场多线作战的军备竞赛。
| 合作伙伴 | 协议规模 | 上线时间 |
|---|---|---|
SpaceX | Colossus 1 全部容量(300MW+/22 万 GPU) | 2026 年 5 月 |
Amazon | 最高 5 吉瓦,含近 1 吉瓦新容量 | 2026 年底 |
Google + Broadcom | 5 吉瓦 | 2027 年 |
Microsoft + NVIDIA | 300 亿美元 Azure 容量 | 多年期 |
Fluidstack | 500 亿美元美国 AI 基础设施投资 | 多年期 |
Anthropic CEO Dario Amodei 曾公开表示,数据中心建设需要18 - 24 个月才能转化为可用容量。此次 SpaceX 协议的即时生效(一个月内上线),意味着 Anthropic 成功争取到一批“即插即用”的现成算力,跳过了漫长的建设周期。
松绑之后,隐忧仍在
对于普通用户而言,5 月 6 日的政策调整意味着。
Pro 用户:不再需要凌晨爬起来写代码以避开高峰限流,五小时窗口内的可用量翻倍后,实际体验接近2月初的Max用户水平;API开发者:Opus 模型的速率限制大幅提升,高并发场景的容错空间显著改善;Max 用户:20 倍乘数现在作用于翻倍后的基线,理论周度可用量达到此前的两倍。
但 Token 通胀 Bug 仍未解决。截至 5 月 4 日的 v2.1.126 版本,官方尚未发布公开修复。社区验证显示,新版本仅修补了 Opus 4.7 的上下文百分比显示 Bug,未触及底层的 Token 膨胀问题。
这意味着,如果我们仍在使用 v2.1.100 至 v2.1.126 之间的版本,实际可用配额可能比 Anthropic 官宣的“翻倍”要缩水 40%。
对应的临时解决方案如下。
# 降级至无 Bug 版本
npx claude-code@2.1.98
结语
Anthropic 与 SpaceX 的合作,是 2026 年 AI 行业最具象征意义的事件之一。它揭示了以下几个深层趋势。
第一,算力已成为比模型算法更稀缺的战略资源。当 Anthropic 这样的顶级实验室需要向竞争对手租用基础设施时,说明 GPU 集群的物理限制正在重塑行业权力结构。
第二,意识形态在基础设施经济学面前可以暂时让步。Musk 从“厌人类”的指控者变为“impressed”的合作伙伴,核心驱动力是 SpaceX 即将 IPO 所需收入叙事,Colossus 1 的闲置算力必须变现。
第三,AI 的终局可能不在地球。轨道数据中心的构想目前看似科幻,但当 Anthropic 和 SpaceX 这样的重量级玩家将其写入正式合作协议时,它至少已成为一个值得严肃对待的工程方向。
对于开发者而言,5 月 6 日的松绑是一个好消息,但也是一个提醒,我们正生活在一个 AI 能力受限于变电站容量、GPU 供货周期和火箭发射能力的奇特时代。今天的翻倍速率限制,可能只是明天太空算力竞赛的前奏。
参考来源
- Anthropic 官方博客:Higher usage limits for Claude and a compute deal with SpaceX
- The Verge:Anthropic’s Claude usage limits are getting a boost after compute deals with SpaceX and others
- Wired:Anthropic Gets in Bed With SpaceX as the AI Race Turns Weird
- Ars Technica:Anthropic raises Claude Code usage limits, credits new deal with SpaceX
- GitHub Issue #46917:CC v2.1.100+ inflates cache_creation by ~20K tokens

最后,欢迎关注我的个人微信公众号:业余草(yyucao)!可加作者微信号:xttblog2。备注:“1”,添加博主微信拉你进微信群。备注错误不会同意好友申请。再次感谢您的关注!后续有精彩内容会第一时间发给您!原创文章投稿请发送至532009913@qq.com邮箱。商务合作也可添加作者微信进行联系!
本文原文出处:业余草: » Claude Code 不限速了,牵手 SpaceX 获得 22 万颗 GPU、300 兆瓦电力