OpenAI 已经把 Codex 放进了 ChatGPT 移动端。这个更新很容易被理解成一个便利功能:现在可以用手机查看编码 Agent 的进度。这个理解没有错,但它低估了这次变化。
更准确的说法是:ChatGPT 移动端正在变成长时间运行的编码 Agent 的控制面板。
OpenAI 表示,用户现在可以在 iOS 和 Android 上监控、引导和审批 Codex 的编码任务,而实际执行仍然发生在笔记本、专用机器、devbox 或托管的远程环境中。[1] 手机并没有取代开发环境。它变成了人类监督 Agent 工作的轻量入口。
这很重要,因为 agentic coding 已经不只是让模型生成一个 patch。真实工作还包括等待、检查、审批、改变方向、比较方案、查看测试输出、判断 diff 是否足够好。这些都是监督时刻。OpenAI 正在把这些监督时刻移动到用户随身携带的设备上。
OpenAI 发布了什么
根据 OpenAI 的说明,Codex 已经以 preview 形式进入 ChatGPT 移动端,覆盖 iOS 和 Android,并在支持地区面向包括 Free 和 Go 在内的所有计划逐步推出。用户需要更新 ChatGPT 移动应用和 macOS 上的 Codex app。手机连接 Windows 版 Codex app 的支持会在之后到来。[1]
官方文章说,Codex 可以连接到已经运行 Codex 的机器,包括笔记本、Mac mini、devbox 或托管远程环境。移动应用会加载这些环境的 live state,让用户继续处理 active thread、approval、plugin 和 project context。[1]
OpenAI 把这个体验描述为超过单个任务的远程控制。用户可以在手机上查看输出、审批命令、切换模型、启动新工作,并跟进 screenshot、terminal output、diff、test result 和 approval 等实时更新。[1]
关键边界在执行位置。OpenAI 表示,文件、credential、permission 和 local setup 仍然留在 Codex 实际运行的机器上。更新会实时同步回手机。OpenAI 还说,Codex 底层使用 secure relay layer,让 trusted machine 可以跨设备访问,同时不直接暴露到 public internet。[1]
这应该被视为 OpenAI 的架构说明,而不是独立安全审计结论。但方向已经很清楚:手机负责界面,可信机器负责执行。
OpenAI 还把移动端发布和更大的企业功能更新放在一起。Remote SSH 现在已经 generally available,Codex 可以通过 desktop app 连接远程开发环境。Programmatic access token 面向 Enterprise 和 Business 计划提供。Hooks 也已经 generally available。OpenAI 还表示,符合条件的 ChatGPT Enterprise workspace 在 local environment 中使用 Codex 时支持 HIPAA-compliant use。[1]
手机不是主要编码界面
把这次更新理解成“用手机写代码”,会错过重点。
在小屏触控设备上认真写代码仍然别扭。在手机上完整审查大型 diff 也有明显限制。深度调试环境问题并不适合移动端。真正的价值在别处。
手机适合短时间介入:
- 审批或拒绝一个命令;
- 回答 clarification question;
- 在两个方案之间做选择;
- 查看测试是否还在运行;
- 阅读简短 summary;
- 在想法还新鲜时启动一个新 thread;
- 让 Codex 继续、停止或换方向。
这些动作都很小。但在长时间运行的 Agent 任务中,这些小判断常常决定任务能否继续推进,还是一直阻塞到用户回到桌前。
这就是为什么这次发布贴合编码 Agent 的真实工作形态。编码 Agent 需要的不只是算力,还需要人类在关键节点给出判断。
为什么这对长时间运行的 Agent 重要
长时间运行的 Agent 会形成一种新的协作节奏。用户不想盯着每一步,但也不能完全消失。可用的 Agent 必须知道什么时候自己继续,什么时候请求 permission、context 或 decision。
OpenAI 的例子也指向这个方向。Codex 可以在用户离开电脑时调查 bug,在继续之前请求 permission,展示 screenshot 和 test result,或者在 refactor 中遇到两个可行方案时等待用户选择。[1]
重点不是单个例子,而是模式。Agent 工作会变成一系列异步 checkpoint:
- 用户启动或分配任务。
- Codex 在真实开发环境中工作。
- Agent 到达 decision、approval 或 evidence 节点。
- 用户从任何地方回应。
- 任务继续推进。
这和人类团队的协作方式很接近。初级工程师、contractor 或 teammate 遇到阻塞时,可能会在 Slack 里请求方向。区别在于,Codex 是在执行循环中带着 terminal output、diff、test、screenshot 和 project context 来提问。
对 Agent 产品来说,这是一次重要的界面变化。界面不只是 prompt box。approval queue、status feed、diff review 和 decision point 都会成为界面的一部分。
远程环境是企业侧的关键
Remote SSH 不是一个小功能。
很多公司并不希望编码 Agent 在配置不一致、权限边界不清楚的个人笔记本上运行。它们已经在使用托管开发环境、批准过的 credential、内部 package mirror、安全策略和标准化 compute。
OpenAI 表示,Codex 现在可以直接连接到这些环境,desktop app 可以从用户的 SSH configuration 中检测 host。[1] 连接之后,这些远程环境可以通过同一套 relay infrastructure 被授权的 ChatGPT 设备访问。[1]
这让移动端故事对团队更有说服力。敏感代码和 credential 不需要进入手机。手机监督的是在受控环境里运行的工作。
问题仍然存在:admin visibility、audit log、policy enforcement、data retention、model routing control,以及移动端 approval 到底携带多少上下文才算安全。但产品方向符合企业购买逻辑。执行留在受治理的基础设施附近,轻量监督跟随用户移动。
它和 Codex Chrome、浏览器 Agent 的关系
这次发布也符合 OpenAI 更大的 Agent surface 策略。
此前,Codex Chrome 让 OpenAI 的编码 Agent 可以使用登录后的浏览器上下文,处理 Gmail、Salesforce、LinkedIn、internal tool 或 product verification 这类任务。[2] 那是在扩展 Agent 可以行动的表面。
ChatGPT 移动端的 Codex 集成是在扩展人类可以监督的表面。
这两个层次不同:
| Layer | 给 Codex 带来什么 | 为什么重要 |
|---|---|---|
| Local 或 remote machine | file、terminal、test、credential、project setup | 真实执行环境 |
| Browser / Chrome | 登录后的 web context 和 product workflow | Agent 可以在 web tool 中验证和操作 |
| ChatGPT mobile | approval、decision、status、review、task start | 人类可以异步监督 |
| Hooks 和 token | customization、automation、CI 和 policy integration | 团队可以把 Codex 嵌入自己的 workflow |
这不只是“在更多地方使用 AI”。围绕实际工作,一个 Agent stack 正在形成:执行表面、浏览器表面、监督表面和策略表面。
这也是为什么这次更新不只是 OpenAI 的事情。Google 正在把 Gemini 推入 Android 和 Chrome。Anthropic 曾探索 Claude for Chrome。Hermes 和 OpenClaw 这样的 Agent runtime 已经把 browser、terminal、file、messaging 和 scheduling 当成同一个操作环境里的工具。共同方向很清楚:Agent 正在靠近真实工作发生的表面。
风险从生成质量转向权限设计
随着 Codex 扩展到更多设备和环境,产品问题也会变化。
重点不只是模型能不能写出好代码,还包括用户和组织能不能在每一刻理解 Agent 拥有什么权限。
移动端 approval button 很强大。它可以让任务继续推进,也可能把严肃决策压缩成一个通知大小的交互。远程环境很有用,但它可能持有接近生产环境的 credential 或内部访问权限。浏览器表面很实用,但也可能暴露登录 session 和敏感客户数据。
优秀的 Agent 产品必须让权限清晰可见:
- Codex 正在哪台 machine 上运行?
- 当前 active 的 repository 或 project 是什么?
- 用户正在审批哪个 command?
- 哪些 file 被修改了?
- 哪些 test 通过或失败了?
- 哪些 credential 或 network surface 在 scope 内?
- 用户从手机 approval 之后,具体会发生什么?
OpenAI 的文章强调 approval、real-time output、local credential boundary、remote environment 和 secure relay。[1] 这些类别是对的。真正的考验是,用户在真实工作中能否足够快地理解这些信息。
FlowHat 观点
ChatGPT 移动端集成让 Codex 更像一个全天候被监督的 Agent,而不是只在桌前打开的工具。
这不意味着开发者应该在手机上审查每一个 diff。手机更适合处理那些让 Agent 不至于停住的小判断:是否批准这个 command、是否选择这个方向、是否基于这个 test result 继续、是否现在开始调查、是否总结当前状态。
这个产品最强的形态不是 mobile coding,而是 asynchronous agent management。
如果 OpenAI 把控制设计好,Codex 会更容易进入真实团队 workflow,因为用户不必一直坐在 Agent 运行的机器前。如果控制太模糊,同一个功能会变成信任问题:太多环境、太少上下文、太快发生的重要 approval。
所以关键问题不是 Codex 能不能塞进手机屏幕。它已经可以。
真正的问题是,OpenAI 能不能把移动端监督做成安全、清晰、真正有用的体验。
References
- OpenAI, Work with Codex from anywhere
https://openai.com/index/work-with-codex-from-anywhere - FlowHat, What Is Codex Chrome? OpenAI’s Coding Agent Moves Into the Browser
/blog/2026-05-11-what-is-codex-chrome-openai-coding-agent-moves-into-browser/