本博客日IP超过2000,PV 3000 左右,急需赞助商。
极客时间所有课程通过我的二维码购买后返现24元微信红包,请加博主新的微信号:xttblog2,之前的微信号好友位已满,备注:返现
受密码保护的文章请关注“业余草”公众号,回复关键字“0”获得密码
所有面试题(java、前端、数据库、springboot等)一网打尽,请关注文末小程序
【腾讯云】1核2G5M轻量应用服务器50元首年,高性价比,助您轻松上云
狡兔三窟,用 AI 也得一样。
今年以来,在使用 AI 方面已经发生过不少事故了。严重的是账号被封禁,个人的或团体的都有,甚至有些小公司立马就无法营业了。
所以,有一些群体就开始了“多备份”,多个厂商的 AI 同时用,预防出现服务故障后,业务无法展开。
然而,今天发生了一件 AI 大厂集体“翻车”的事件,OpenAI、Claude 同时宕机,开发者圈里都炸锅了!ChatGPT、Codex、Claude Code 等核心产品纷纷“罢工”。截止目前,openai 的故障还没有恢复呢。
OpenAI 服务故障
根据 OpenAI 官方状态页显示,目前 OpenAI 正在经历一场持续约3小时的服务故障,影响范围包括 Codex、ChatGPT 和 Responses API。
status.openai.com 上官方公告称:“我们已应用缓解措施,正在监控恢复情况。”但目前仍有大量用户在 DownDetector 等平台报告无法正常使用服务。
Claude 一天之内两次故障
相比 OpenAI 的长时间故障,Claude 今天的故障已经“告一段落”,但过程同样惊心动魄。
根据 Anthropic 官方状态页记录,今天(6 月 3 日)Claude 遭遇了两次服务中断(status.claude.com)。
- 第一次故障(UTC 04:17-07:36):影响部分 Claude Code 服务,包括安全审查、代码审查、例程等功能出现异常
- 第二次故障(UTC 07:10-07:38):Opus 4.7 模型出现大量错误
虽然两次故障都在半小时内解决,但对于正在赶工期的开发者来说,这半小时足以让人崩溃。
有海外开发者在 Hacker News 上吐槽:“Claude 的可用性已经跌破 99% 了”。
社区炸锅
AI 一故障,社区里就会炸锅。
- OpenAI 和 Claude 同一天宕机,这是约好的吗?我的项目 deadline 就在今天啊!
- Claude 半个月崩 7 次,这稳定性还不如我写的代码(手动狗头)
- 花了 20 刀买的 Plus 会员,就这服务体验?退钱!
- 天太热了,服务器也要开空调,建议液冷散热
我们怕 token 用完,又怕 token 用不完。token 用不完,那一定是哪里出了问题。
AI 宕机家常便饭
如果大家以为今天的故障是偶然事件,那就太天真了。回顾 2026 年以来的 AI 服务故障记录,就会发现宕机已经成为 AI 大厂的“新常态”。
就连 Claude 也从“稳定标杆”到“故障王”了,根据 Claude 的状态页可知,平均几乎每天都有故障,不过是大小而已。连续 3 天不出故障的次数屈指可数,以至于有网友说到:“Claude 的 2026 年,不是在宕机,就是在去宕机的路上”。
OpenAI 也是老毛病反复发作,故障有时候比 Claude 还严重。根据下图可知,故障次数和 Claude 半斤八两。
国内的也一样,以 DeepSeek 为例,2026 年整个 5 月累计出现 5 次服务异常,一个月内第 4 次大型故障,API 小故障也是家常便饭,几乎每天都有。
为什么 AI 大厂总故障
面对此起彼伏的宕机事件,我们不禁要问了:“为什么 AI 大厂总是修不好稳定性问题?”
文章配图参见 https://mp.weixin.qq.com/s/spLN51DYe7pFv-gCEzGKFw。
究其主要原因有下面 4 点,供大家参考。
用户量暴增,算力跟不上
这是最直接的原因。以 Claude 为例,Anthropic 官方披露,自 2026 年 1 月以来,Claude 免费用户数量增长超过 60%,付费订阅用户在年内已经翻倍。
其它模型也类似,比如 DeepSeek,专家模式把上传附件的功能给关闭了,智能搜索也给关闭了,另外前段时间灰度的识图模式到现在还没有全量开放。
基础设施脆弱
多家 AI 厂商高度依赖少数几家云服务商(主要是 AWS、Azure、GCP、阿里云等),一旦这些云服务商出问题,就会引发连锁反应。
高度依赖少数算力节点与物理网络,一旦出事就是多米诺骨牌效应。
技术迭代过快
在 AI 军备竞赛的大背景下,各大厂商都在拼命推出新功能、新模型,稳定性往往被放在次要位置。
以 Claude Opus 4.7 为例,这个 4 月中旬发布的新模型,上线后就频繁出现错误。也有圈内人指出:“现在的 AI 公司都在抢时间,先上线再优化,稳定性只能往后排。”
攻击事件频发
除了技术原因,安全攻击也是导致宕机的重要因素。
OpenAI 曾透露,2025 年 11 月 ChatGPT 长达 90 分钟的宕机与 DDoS 攻击有关。在 AI 成为关键基础设施的今天,安全防护压力与日俱增。
即使是攻击少,某些场景下的 Agent 时不时的会触发系统级严重 bug。比如 Claude 今日发生的子 Agent 无限循环问题等。
最后
今日的 AI “宕机潮”,或许正是 AI 行业走向成熟的“成人礼”。
过去几年,AI 技术发展日新月异,各大厂商拼命追求模型性能、功能创新,却忽视了最基础的稳定性问题。今天的频繁宕机,正是为过去的“狂飙突进”买单。
这或许也是行业走向成熟的必经之路。

最后,欢迎关注我的个人微信公众号:业余草(yyucao)!可加作者微信号:xttblog2。备注:“1”,添加博主微信拉你进微信群。备注错误不会同意好友申请。再次感谢您的关注!后续有精彩内容会第一时间发给您!原创文章投稿请发送至532009913@qq.com邮箱。商务合作也可添加作者微信进行联系!
本文原文出处:业余草: » ChatGPT、Claude、Codex 集体故障同一天宕机