Java基础、中级、高级、架构面试资料

ChatGPT、Claude、Codex 集体故障同一天宕机

业余杂谈 herman 19浏览
公告:“业余草”微信公众号提供免费CSDN下载服务(只下Java资源),关注业余草微信公众号,添加作者微信:xttblog2,发送下载链接帮助你免费下载!
本博客日IP超过2000,PV 3000 左右,急需赞助商。
极客时间所有课程通过我的二维码购买后返现24元微信红包,请加博主新的微信号:xttblog2,之前的微信号好友位已满,备注:返现
受密码保护的文章请关注“业余草”公众号,回复关键字“0”获得密码
所有面试题(java、前端、数据库、springboot等)一网打尽,请关注文末小程序
视频教程免费领
【腾讯云】1核2G5M轻量应用服务器50元首年,高性价比,助您轻松上云

狡兔三窟,用 AI 也得一样。

今年以来,在使用 AI 方面已经发生过不少事故了。严重的是账号被封禁,个人的或团体的都有,甚至有些小公司立马就无法营业了。

所以,有一些群体就开始了“多备份”,多个厂商的 AI 同时用,预防出现服务故障后,业务无法展开。

然而,今天发生了一件 AI 大厂集体“翻车”的事件,OpenAI、Claude 同时宕机,开发者圈里都炸锅了!ChatGPT、Codex、Claude Code 等核心产品纷纷“罢工”。截止目前,openai 的故障还没有恢复呢。

OpenAI 服务故障

根据 OpenAI 官方状态页显示,目前 OpenAI 正在经历一场持续约3小时的服务故障,影响范围包括 Codex、ChatGPT 和 Responses API。

status.openai.com 上官方公告称:“我们已应用缓解措施,正在监控恢复情况。”但目前仍有大量用户在 DownDetector 等平台报告无法正常使用服务。

Claude 一天之内两次故障

相比 OpenAI 的长时间故障,Claude 今天的故障已经“告一段落”,但过程同样惊心动魄。

根据 Anthropic 官方状态页记录,今天(6 月 3 日)Claude 遭遇了两次服务中断(status.claude.com)

  1. 第一次故障(UTC 04:17-07:36):影响部分 Claude Code 服务,包括安全审查、代码审查、例程等功能出现异常
  2. 第二次故障(UTC 07:10-07:38):Opus 4.7 模型出现大量错误

虽然两次故障都在半小时内解决,但对于正在赶工期的开发者来说,这半小时足以让人崩溃。

有海外开发者在 Hacker News 上吐槽:“Claude 的可用性已经跌破 99% 了”。

社区炸锅

AI 一故障,社区里就会炸锅。

  • OpenAI 和 Claude 同一天宕机,这是约好的吗?我的项目 deadline 就在今天啊!
  • Claude 半个月崩 7 次,这稳定性还不如我写的代码(手动狗头)
  • 花了 20 刀买的 Plus 会员,就这服务体验?退钱!
  • 天太热了,服务器也要开空调,建议液冷散热

我们怕 token 用完,又怕 token 用不完。token 用不完,那一定是哪里出了问题。

AI 宕机家常便饭

如果大家以为今天的故障是偶然事件,那就太天真了。回顾 2026 年以来的 AI 服务故障记录,就会发现宕机已经成为 AI 大厂的“新常态”

就连 Claude 也从“稳定标杆”到“故障王”了,根据 Claude 的状态页可知,平均几乎每天都有故障,不过是大小而已。连续 3 天不出故障的次数屈指可数,以至于有网友说到:“Claude 的 2026 年,不是在宕机,就是在去宕机的路上”。

OpenAI 也是老毛病反复发作,故障有时候比 Claude 还严重。根据下图可知,故障次数和 Claude 半斤八两。

国内的也一样,以 DeepSeek 为例,2026 年整个 5 月累计出现 5 次服务异常,一个月内第 4 次大型故障,API 小故障也是家常便饭,几乎每天都有。

为什么 AI 大厂总故障

面对此起彼伏的宕机事件,我们不禁要问了:“为什么 AI 大厂总是修不好稳定性问题?”

文章配图参见 https://mp.weixin.qq.com/s/spLN51DYe7pFv-gCEzGKFw

究其主要原因有下面 4 点,供大家参考。

用户量暴增,算力跟不上

这是最直接的原因。以 Claude 为例,Anthropic 官方披露,自 2026 年 1 月以来,Claude 免费用户数量增长超过 60%,付费订阅用户在年内已经翻倍

其它模型也类似,比如 DeepSeek,专家模式把上传附件的功能给关闭了,智能搜索也给关闭了,另外前段时间灰度的识图模式到现在还没有全量开放。

基础设施脆弱

多家 AI 厂商高度依赖少数几家云服务商(主要是 AWS、Azure、GCP、阿里云等),一旦这些云服务商出问题,就会引发连锁反应。

高度依赖少数算力节点与物理网络,一旦出事就是多米诺骨牌效应。

技术迭代过快

在 AI 军备竞赛的大背景下,各大厂商都在拼命推出新功能、新模型,稳定性往往被放在次要位置。

以 Claude Opus 4.7 为例,这个 4 月中旬发布的新模型,上线后就频繁出现错误。也有圈内人指出:“现在的 AI 公司都在抢时间,先上线再优化,稳定性只能往后排。”

攻击事件频发

除了技术原因,安全攻击也是导致宕机的重要因素。

OpenAI 曾透露,2025 年 11 月 ChatGPT 长达 90 分钟的宕机与 DDoS 攻击有关。在 AI 成为关键基础设施的今天,安全防护压力与日俱增。

即使是攻击少,某些场景下的 Agent 时不时的会触发系统级严重 bug。比如 Claude 今日发生的子 Agent 无限循环问题等。

最后

今日的 AI “宕机潮”,或许正是 AI 行业走向成熟的“成人礼”。

过去几年,AI 技术发展日新月异,各大厂商拼命追求模型性能、功能创新,却忽视了最基础的稳定性问题。今天的频繁宕机,正是为过去的“狂飙突进”买单。

这或许也是行业走向成熟的必经之路。

业余草公众号

最后,欢迎关注我的个人微信公众号:业余草(yyucao)!可加作者微信号:xttblog2。备注:“1”,添加博主微信拉你进微信群。备注错误不会同意好友申请。再次感谢您的关注!后续有精彩内容会第一时间发给您!原创文章投稿请发送至532009913@qq.com邮箱。商务合作也可添加作者微信进行联系!

本文原文出处:业余草: » ChatGPT、Claude、Codex 集体故障同一天宕机