
Claude Code 的强大是因为sonet4模型强还是工具强?
Claude Code 的强大,首先是模型的强大,Claude 4 无论是 Sonnet 还是 Opus,在编程和 Agent 能力上都很强!这是成功的基础。
然后是内置工具的强大,Claude Code 内置有 18 个工具,这些工具有 Grep 检索代码的,有执行命令的,有 TODO 读写的工具,有架构分析的工具,模型借助这些工具模拟了程序员解决问题的思路:制定计划、分析问题、检索代码库找到相应的代码位置、解决问题、测试验证。
另外最神奇的那个工具就是 Task 工具我反复提到过,它能给 Claude Code 开分身,执行子任务,既可以专注于子任务不受其他信息干扰,又可以避免主线任务无关上下文太多,还能有 Claude Code 一样的工具能力。
再有就是不计成本,Claude Code 默认是不会压缩任何上下文信息的,每请求一次就把之前的历史会话、工具调用和返回结果都一起发过去,所以它不会遗失上下文,其他工具像 Cursor 都得抠抠塞塞压缩上下文节约成本,还限制次数,没执行几次都不跑了问你是不是要继续。
还有就是 Claude Code 是 cli 命令行程序,没有 IDE 的包袱,像 Cursor 这样的 IDE,每次请求都需要考虑要把很多 IDE 的信息放到上下文中,比如打开了几个 Tabs,Tabs 的代码都是啥,当前选中的是啥代码,这些信息不提供可能损失了上下文,提供了又可能就会降低上下文相关度以及挤占上下文长度,反倒是 Claude Code 默认不需要 IDE 的上下文,自己缺什么信息就自己去用工具检索代码库或者联网查询,这样上下文都是自己想要的。
不过 Task 虽然能调用工,但是提示词里面要求不能编辑代码文件,因为如果修改可能会破坏主任务中的上下文 === 5. IMPORTANT: The agent can not use ${http://BashTool.name}, ${http://FileWriteTool.name}, ${http://FileEditTool.name}, ${http://NotebookEditTool.name}, so can not modify files. If you want to use these tools, use them directly instead of going through the agent.` ===

为什么 OpenAI 的 Codex 也比 Claude Code 要落后一截?
我觉得模型是根本原因,虽然 OpenAI 也对标训练了 Codex 模型(还没对外发布),但是已经比 Anthropic 落后了一大截。Claude Code 正式对外发布是在今年 2 月份,而实际上在对外发布之前,Anthropic 内部早已经大量使用了 Claude Code,并且反响特别好,我猜测他们在训练 Claude 4 的时候,针对 Claude Code 内置的工具结合他们内部使用的场景和数据,做了大量强化学习,让 Claude Code 在 Claude 4 上效果特别突出。而 OpenAI 明显晚了几个月,并没有足够的针对编程工具和编程场景的强化训练,这需要一点时间弥补。
另外现在 Claude Code 可以包月使用,Anthropic 明显是亏钱的,但我猜测他们应该是看重了用户使用 Claude Code 时产生的大量用户行为数据,可以分析出来各种编程场景,工具的使用结果,而这部分数据对于他们训练下一代的模型至关重要,也就是传说中的数据飞轮效应,所以它愿意亏本去卖以换取优质数据。
相反 OpenAI 就很让人失望,给 o1 pro 用户提供的都只是 codex-mini 这样的模型,能力很弱,做不了啥事。
然后 codex 团队还在忙着用 Rust 重写 codex-cli,其实只要产品效果好,谁在乎你是啥语言写的,nodejs 又怎么样,慢就慢一点,Agent 跑几十分钟我都能等,还在乎你语言层面那一点性能差异或者是需要额外装一个nodejs吗?只要出来的结果好!
(本文转载自 宝玉 推特 @dotey)