我为什么在 13 个月后取消了 Claude Max,以及接下来 30 天我准备如何用 Codex 做测试
我在连续使用 13 个月、总共支付 US$1,892.38 之后取消了 Claude Max。这 不是庆祝帖,而是一个 30 天的实验:看看把 Codex 作为主力工具之后,我还 能不能以同样的节奏继续推进 STRATUM、DIALOGUE、课程平台和这个网站。
昨天我取消了 Claude Max。
我之前已经写过为什么我开始同时用 Codex 和 Claude Code,也写过为什么那个月付 200 美元的计划,在我的工作流里开始越来越难以自圆其说。这篇文章讲的是最后这一步:我真的取消了。
我在 Claude Max 上待了 13 个月,一共付了 US$1,892.38。但说得更准确一点,真正大量出现在我日常工作里的价值,其实是通过 Claude Code 体现出来的:这个网站、课程平台、STRATUM、DIALOGUE、博客流水线,还有视频系统。所以这次取消,不只是成本决定。它是一个工作流决定。
我为什么取消
原因有三个,按重要性排序。
-
Codex with GPT-5.4 追得非常快。 我现在经常会让一个 AI 先做诊断和计划,再让另一个 AI 来挑错和批评。过去几周里,Claude Code 对 Codex 结论的认可越来越多,而 Codex 给出的计划往往只需要很小的修改。两个月前还不是这样。
-
价格差越来越难解释。 Codex 是每月 20 美元,而且 usage limits 相当宽松。Claude Max 是 200 美元。当执行质量开始收敛时,10 倍的价格就必须每天都证明自己为什么值得。
-
我想亲自看看,把我最依赖的那个工具拿掉之后,会发生什么。 我还能不能保持现在的 shipping 节奏?我还能不能继续推进这个网站、课程、STRATUM 和 DIALOGUE,而不是本能地回到过去一年里默认使用的那个工具?老实说,我现在还不知道。也正因为不知道,这个实验才值得做。
我也得承认,Anthropic 最近的 reliability issues 并没有帮到它。再加上过去一周里,带 1M context window 的 Opus 4.6 在相同 thinking level 下,体感上明显比 GPT-5.4 慢。这可能只是暂时现象。但它确实让这个决定变得更容易了。
如果你想看更完整的版本——newsletter 的故事、SSE bug 这些具体细节——可以去读昨天那篇文章,那里展开得更细。
这 30 天我准备怎么测
接下来的 30 天,我会把月付 20 美元的 Codex 当作主力工具来用。我想观察四件事:
- Shipping speed——和 3 月平均值相比,我每周到底还能推进多少
- 代码质量与返工——第二天我需要回头修补的次数会不会变多
- 长时间 session 里的 reliability——它到底能帮我多久,什么时候开始拖后腿
- Avoidance behavior——有没有一些任务,我会因为替代工具在那方面更弱,而开始拖着不做,或者换一种方式绕过去
最后这一点比听起来重要得多。一个工具不需要戏剧性地失败,才会变得昂贵。有时候,它只是悄悄改变了你还愿不愿意去尝试某些事情。
我给自己的承诺
我不想让这件事变成那种 build in public 式的决定:24 小时里看起来很戏剧化,然后就悄悄消失。
所以我在这里把话写清楚:
在 2026 年 5 月 2 日,我会写一篇 follow-up:最先坏掉的是什么,什么反而变容易了,我会怀念 Claude 的哪些地方,以及如果再来一次,我还会不会做同样的选择。这个实验完全可能以我重新订阅收场。不管结果是什么,那篇 follow-up 都会比“我取消了”这件事本身更有价值。
我知道,这已经是三周里围绕这个话题的第三篇文章了。这篇发完之后,我会闭嘴,认真 ship 30 天。
先写到这里。如果你也做过类似的切换,或者正在尝试类似的工作流,我真的很想知道,过了最初几周之后,你那边到底发生了什么变化。
回头见,Chandler





