2025年5月16日 作者 D.Sheep 0

🚀 OpenAI 重磅发布 Codex:AI 编程助手新时代来临!

Codex 是一个可以并行执行多个任务的云端 AI 编程助手。它可以为你完成各种开发任务,比如:

  • 编写新功能 ✨
  • 回答你关于代码库的问题 ❓
  • 修复 bug 🐞
  • 提交 Pull Request(合并请求)供你审阅 ✅

每个任务都会在一个独立的云沙箱环境中运行,并预加载你的代码仓库 🧰。


🧠 Codex 的核心技术

Codex 由 codex-1 提供支持,这是 OpenAI o3 模型的一个特别版本,专为软件工程任务优化。它通过强化学习在多种真实编程环境中接受训练,能够:

  • 生成符合人类风格和代码评审偏好的代码 ✍️
  • 精确遵循指令 📋
  • 自动运行测试,直到通过为止 ✅

今天起,Codex 将率先面向 ChatGPT Pro、Enterprise 和 Team 用户开放,未来还将支持 Plus 和 Edu 用户 👨‍💻👩‍💻。


🛠️ Codex 如何工作?

你现在可以通过 ChatGPT 侧边栏访问 Codex:

  • 发送任务提示词后点击「Code」即可指派新的编码任务
  • 如果想询问 Codex 关于你代码库的问题,点击「Ask」即可

每个任务都会在一个独立、隔离的环境中处理,加载你的完整代码仓库。Codex 可以:

  • 读取和编辑文件 📂
  • 运行命令、测试工具、格式检查器、类型检查器等 🧪

任务完成时间根据复杂度通常在 1 到 30 分钟之间,并支持实时进度监控 ⏱️。


📝 透明可追溯的变更

任务完成后,Codex 会将改动提交到它的沙箱环境中,并通过 终端日志和测试结果的引用提供可验证的证据,让你可以清晰追踪每一步操作 🧾。你可以:

  • 审阅修改内容
  • 请求进一步修改
  • 提交 GitHub Pull Request
  • 或直接集成到本地开发环境中 🚀

你还可以配置 Codex 的运行环境,使其尽可能接近你的真实开发环境 ⚙️。


📘 使用 AGENTS.md 指导 Codex

你可以在代码仓库中添加 AGENTS.md 文件,就像 README.md 一样,用来告诉 Codex:

  • 如何理解项目结构
  • 如何运行测试
  • 如何遵循项目规范 ✅

就像人类开发者一样,Codex 在拥有良好环境、可靠测试和清晰文档的条件下表现最好 🌟。

即使没有 AGENTS.md 文件或自定义脚手架,Codex 也在代码评估和内部基准测试中表现出色 💪。


📊 表现如何?

在多组编码基准测试中,Codex(codex-1)在各种设定下的准确率如下所示:

  • SWE-Bench Verified:准确率从 11%(o1)提升至 75%(codex-1) 📈
  • OpenAI 内部软件工程任务:codex-1 表现显著优于之前的 o 系列模型 🎯

这些测试在最长 192k token 上下文中运行,并使用中等推理复杂度,是 Codex 当前产品设定下的默认模式 🧪。


🔐 构建安全、可信任的智能代理

Codex 是以研究预览形式发布的,这符合 OpenAI 一贯的渐进式部署策略。我们在设计 Codex 时将安全性和可审查性放在首位,以确保用户可以验证每一次自动化操作 🔍。

当遇到不确定性或测试失败时,Codex 会明确指出问题,帮助你做出正确判断 🧯。不过,用户在将 Codex 的建议代码整合或部署之前,仍应人工审查和验证其输出 ✔️。


🤝 贴近人类开发者的风格

我们在训练 codex-1 时的主要目标之一,就是让它的输出更贴近人类开发者的偏好与规范。相较于 OpenAI o3,codex-1 生成的代码更加整洁、符合评审要求,更适合直接纳入实际工作流程 👨‍💻👩‍💻。


Codex 正在一步步将“智能开发伙伴”从概念变为现实。未来,它或许将成为你团队中不可或缺的工程助手 🤖💼。快来尝试一下,在 ChatGPT 中解锁你的 AI 编程搭档吧!


如果你需要,我也可以帮你将这篇内容整理成适合微信公众号、知乎或小红书风格的发布版本。是否需要我继续优化?