
🚀 OpenAI 重磅发布 Codex:AI 编程助手新时代来临!
Codex 是一个可以并行执行多个任务的云端 AI 编程助手。它可以为你完成各种开发任务,比如:
- 编写新功能 ✨
- 回答你关于代码库的问题 ❓
- 修复 bug 🐞
- 提交 Pull Request(合并请求)供你审阅 ✅
每个任务都会在一个独立的云沙箱环境中运行,并预加载你的代码仓库 🧰。
🧠 Codex 的核心技术
Codex 由 codex-1 提供支持,这是 OpenAI o3 模型的一个特别版本,专为软件工程任务优化。它通过强化学习在多种真实编程环境中接受训练,能够:
- 生成符合人类风格和代码评审偏好的代码 ✍️
- 精确遵循指令 📋
- 自动运行测试,直到通过为止 ✅
今天起,Codex 将率先面向 ChatGPT Pro、Enterprise 和 Team 用户开放,未来还将支持 Plus 和 Edu 用户 👨💻👩💻。
🛠️ Codex 如何工作?
你现在可以通过 ChatGPT 侧边栏访问 Codex:
- 发送任务提示词后点击「Code」即可指派新的编码任务
- 如果想询问 Codex 关于你代码库的问题,点击「Ask」即可
每个任务都会在一个独立、隔离的环境中处理,加载你的完整代码仓库。Codex 可以:
- 读取和编辑文件 📂
- 运行命令、测试工具、格式检查器、类型检查器等 🧪
任务完成时间根据复杂度通常在 1 到 30 分钟之间,并支持实时进度监控 ⏱️。
📝 透明可追溯的变更
任务完成后,Codex 会将改动提交到它的沙箱环境中,并通过 终端日志和测试结果的引用提供可验证的证据,让你可以清晰追踪每一步操作 🧾。你可以:
- 审阅修改内容
- 请求进一步修改
- 提交 GitHub Pull Request
- 或直接集成到本地开发环境中 🚀
你还可以配置 Codex 的运行环境,使其尽可能接近你的真实开发环境 ⚙️。
📘 使用 AGENTS.md 指导 Codex
你可以在代码仓库中添加 AGENTS.md 文件,就像 README.md 一样,用来告诉 Codex:
- 如何理解项目结构
- 如何运行测试
- 如何遵循项目规范 ✅
就像人类开发者一样,Codex 在拥有良好环境、可靠测试和清晰文档的条件下表现最好 🌟。
即使没有 AGENTS.md 文件或自定义脚手架,Codex 也在代码评估和内部基准测试中表现出色 💪。
📊 表现如何?
在多组编码基准测试中,Codex(codex-1)在各种设定下的准确率如下所示:
- SWE-Bench Verified:准确率从 11%(o1)提升至 75%(codex-1) 📈
- OpenAI 内部软件工程任务:codex-1 表现显著优于之前的 o 系列模型 🎯
这些测试在最长 192k token 上下文中运行,并使用中等推理复杂度,是 Codex 当前产品设定下的默认模式 🧪。
🔐 构建安全、可信任的智能代理
Codex 是以研究预览形式发布的,这符合 OpenAI 一贯的渐进式部署策略。我们在设计 Codex 时将安全性和可审查性放在首位,以确保用户可以验证每一次自动化操作 🔍。
当遇到不确定性或测试失败时,Codex 会明确指出问题,帮助你做出正确判断 🧯。不过,用户在将 Codex 的建议代码整合或部署之前,仍应人工审查和验证其输出 ✔️。
🤝 贴近人类开发者的风格
我们在训练 codex-1 时的主要目标之一,就是让它的输出更贴近人类开发者的偏好与规范。相较于 OpenAI o3,codex-1 生成的代码更加整洁、符合评审要求,更适合直接纳入实际工作流程 👨💻👩💻。
Codex 正在一步步将“智能开发伙伴”从概念变为现实。未来,它或许将成为你团队中不可或缺的工程助手 🤖💼。快来尝试一下,在 ChatGPT 中解锁你的 AI 编程搭档吧!
如果你需要,我也可以帮你将这篇内容整理成适合微信公众号、知乎或小红书风格的发布版本。是否需要我继续优化?