OpenAI大神教你如何榨干Codex

资讯组小编 • 文章来源: 量子位 • 12小时前 • 新闻

新晋员工确实毫无保留。

Jason Liu，13k星开源库Instructor的作者，刚被OpenAI招进Codex团队没多久，不仅在社交平台大方发API额度；

还写了篇Codex-maxxing，把自己的Codex玩法全抖出来了。

而且是让Codex自动跟进亚马逊退款、定时扫Slack接需求、开着Heartbeats在你洗澡的时候帮你干活的那种。

Codex周活用户4月底已经破了400万，终于来了份“官方使用指南”。

正好，这两天Codex又更新了一波：Appshots截图直喂、Goal模式正式转正、锁屏后也能远程干活。

跟Jason的使用心法叠在一起看会发现，现在大家比拼的，是谁能持续工作更久，谁能真正上岗了……

让它自己跑起来

Jason整套玩法的核心，是把Codex改造成了一个能长期运行、持续接管任务的工作系统。

多数人习惯单次问答结束就关闭会话，但Jason是开着一堆跨月存活的巨型线程，不会随意终止。

他给每个工作流一个置顶线程：管日程的一个、管开源项目的一个、监控社交平台的一个……通过Command-1到Command-9一键跳转。

线程里积累了几个月的对话历史、偏好和决策，再次使用时不用重新交代背景，Agent就能自动承接进度。

当线程生命周期被拉长后，项目背景、沟通习惯和历史决策都会自然沉淀进去，Agent开始具备连续性。

而且Jason下任务不打字，主要靠说。

在他看来，口述能完整保留原始思路，不需要刻意优化Prompt，可以直接把模糊、跳跃、带溯源需求的想法原样丢给Agent。

再配合Codex的Steering功能，还能在Agent执行任务时插队追加指令，说完就走，不用干等。

不过，真正让Codex从工具变员工的，是Heartbeats+@computer这套组合拳。

Heartbeats本质上相当于给Agent加了一层定时任务调度。

Jason有个Chief of Staff线程，每30分钟跑一次——

扫一遍Slack和Gmail，看看有没有需要回复的消息，判断优先级，需要回复的先起草一份草稿，但不发送，最终由人来决定是否发出。

他还举了一个更复杂的例子是，做动画项目时，他会先把视频发到Slack审阅线程，然后让Codex每15分钟检查一次线程。

如果同事提了反馈，Codex就重新渲染一个新版本并回复到线程里。

因为Slack MCP服务器还不支持文件上传，Agent甚至会自己调用@computer去点“Add file”按钮，把渲染好的文件传上去。

类似的流程，现在已经能扩展到Google Docs评论、GitHub PR Review等场景，只要有反馈就自动推进下一步。

Jason最强调的一点，是验证机制，可以判断任务什么时候终止。

他试过让Codex把Python的Rich库完整迁移到Rust，硬性要求是必须通过原Python库的所有单元测试。

测试能不能通过，决定了任务是否完成；失败了，Agent就继续修。

用他的话说：

没有验证机制的野心，顶多算个愿望而已。

而在最新的这次更新中，OpenAI已经把Goal模式从实验版本转正了。

你只要明确一个最终目标和验收标准，Codex会自主持续推进，短则几小时长则数天，中途可以查进度、调方向，也可以直接暂停。

但前提是任务本身必须存在清晰、可验证的反馈闭环。

记忆放在自己手里

Jason这套用法的另一大核心思路，是个人工作记忆不应该托管在平台内部。

他所有的长期线程都从一个Obsidian vault起步，目录划分为TODO、people、projects、agent、notes等板块。

在顶层AGENTS.md里写明规则：人员信息更新、项目推进、待办办结等变动，都要同步更新知识库对应内容。

也就是说，他几乎放弃了Codex的内置记忆系统，把核心记忆数据存放在本地可控文件中，既能随时查阅手动修改，也能通过版本对比查看变动，出现问题还能一键roll back。

原因是AI承载的记忆体量越大，就越不该把数据锁死在单一平台。

而文件是完全属于用户自己的，后续想换工具、迁平台，拎着知识库就能走，毫无顾虑。

他也提到了Codex自带的记忆功能Chronicle，通过截取屏幕内容来构建上下文。

但这是需要手动开启的实验预览功能，在权限、速率和隐私方面存仍在短板，整体方向可行但还不够成熟。

所以，在他看来，文件系统仍然是最可靠的记忆基础设施。

而且Codex工作台本身也在升级。

Codex的侧边栏不再局限聊天交互，可直接渲染Markdown、筛选表格、阅览PDF与PPT。

Agent还能通过内置浏览器用Java控制网页，用户可以边看边标注，不用来回切窗口。

Jason说他经常在侧边面板里同时打开Storybook审阅UI组件、用Remotion Studio做动画、用Slidev做演示文稿。

而他最喜欢的交付形式，就是一个带JS和CSS的单文件index.html，不用部署，不用服务器，打开就能跑。

另外，他还把Connectors和Skills作为可复用工作流模版。

只要成功做完一件有用的事，就把流程打包起来，下次Codex不用重新学，直接调用就行。

最近Codex还补了一手远程能力，电脑锁屏后Codex可以继续工作，手机端也能实时查看、审批甚至接管任务。

现在好了，你下班它加班，你锁屏它干活，超额KPI这不就来了……

不过，当AI可以持续接管工作，人自己倒是越来越轻松了（doge）。

本文来自转载量子位，观点仅代表作者本人，发现AI平台仅提供信息存储空间服务。
如若转载，请联系原作者；如有侵权，请联系编辑删除。

赞 (0)

资讯组小编

微信扫一扫

微信扫一扫

中国台湾首次破获AI服务器违规出口案涉案约50台价值2500万美元

上一篇 13小时前

AI爱因斯坦快了，工业革命100倍冲击！Anthropic联创预言2028跨越奇点

AI爱因斯坦快了，工业革命100倍冲击！Anthropic联创预言2028跨越奇点

下一篇 12小时前

扫码关注我们，了解最新AI资讯~

新闻

马斯克“秘密求和”被拒，OpenAI总裁300亿财富曝光

资讯组小编
2026年5月5日
新闻

9.9元起！三大运营商杀入Token生意，以后用AI就像交话费？

资讯组小编
4天前
新闻

2605随笔-美国行：AI泡沫什么时候会破？

资讯组小编
2026年5月13日
新闻

字节回应“亿元年薪挖DeepSeek员工”

资讯组小编
2026年4月16日
新闻

4人团队花几百块做出百万流水，AI+UGC的“黄金时代”要来了？

资讯组小编
2026年4月14日
新闻

马斯克花100亿想清楚一件事，不做coding agent就是等死

资讯组小编
5天前

发表回复

登录后才能评论

DeepSeek API提速扩容并调整V4-Pro定价
2小时前
分享到:

2026年5月23日，DeepSeek宣布其API完成输出提速与服务扩容，默认支持500并发在线；同时宣布DeepSeek-V4-Pro模型API优惠将于5月31日结束，此后价格调整为原价的1/4。调整后输入（缓存命中）0.025元/百万Tokens，输入（未命中）3元/百万Tokens，输出6元/百万Tokens。企业用户可在线申请更高并发权限。此次升级旨在提升服务稳定性与响应效率。
职场现“AI信心鸿沟”：63%员工夸大AI技能
2小时前
分享到:

近日，GCheck发布的调查显示，63%职场员工曾夸大AI技能以提升竞争力，Z世代中比例达80%。仅34%受访者确信能完成所有声称掌握的AI任务。40%人在会议中故作精通，25%将AI辅助成果归为个人业绩。76%坦言属“先说会、再学习”，70%视其为职场常态。焦虑驱动为主因：69%担忧两年内AI替代部分工作，52%害怕因AI能力不足被裁员。64%企业未核实员工AI能力。专家呼吁建立透明评估机制，缓解自动化焦虑。
国家数据局：将把推动词元经济发展纳入工作体系
5小时前
分享到:

据国家数据局消息，5月22日，国家数据局党组书记、局长刘烈宏主持召开词元经济座谈会。会上，中国经济时报社、习近平经济思想研究中心、中国政法大学、中国人民大学、清华大学等单位的专家代表，阿里云、腾讯、月之暗面、海天瑞声、中国国际金融有限公司等企业代表，围绕“推动词元经济健康可持续发展，充分释放数据要素价值”发表意见建议。国家数据局党组成员、副局长夏冰出席会议。
Linus Torvalds：AI正改变Linux内核开发节奏
9小时前
分享到:

5月23日，Linus Torvalds在Linux基金会北美开源峰会上指出，过去6个月内核提交量激增约20%，主因是AI编码工具已实用化。他肯定AI降低贡献门槛、提升效率，但警示其放大了评审、沟通等社会性瓶颈。例如，内核安全邮件列表被大量AI生成的重复漏洞报告淹没。Torvalds反对公开可利用的攻击代码，也否定“99%代码由AI编写”的说法，强调开发者仍须深度理解系统与代码。
企业AI热潮遇成本反噬：微软收缩授权、优步提前耗尽年度预算
9小时前
分享到:

2026年5月，微软取消多数员工对Claude Code的直接授权，转向自研AI编程工具；优步则于4月宣布已用尽全年AI工具预算。此前数月，两公司均曾大力推广员工高频使用AI。原因在于AI按token计费模式下，使用量激增导致算力与运营成本飙升——英伟达高管坦言部分团队算力支出已超人力成本。高盛预测2030年全球月度token消耗将达120千万亿，Gartner指出Agent类模型虽单次推理成本下降，但总消耗增速更快。AI降本增效的预期正面临现实挑战。
工程师警示AI编程致‘vibe slop’风险加剧
12小时前
分享到:

2026年5月22日，华尔街日报报道，OpenClaw项目工程师马里奥·泽克纳与阿明·罗纳彻发出警告：AI虽提升编码速度，却正批量输出低质量代码。二人指出，当前AI工具被滥用为替代资深开发者手段，导致漏洞增多、服务中断及技术债务累积。该现象被称作‘vibe slop’，即氛围式编程叠加AI生成垃圾代码。专家强调，AI仅宜用于草稿与原型开发，正式系统仍须人工审查、测试与安全评估。忽视此边界将使修复成本远超初期开发节省。
ChatGPT上线表单语音自动填写功能
12小时前
分享到:

2026年5月23日，OpenAI宣布ChatGPT新增表单智能填写能力。用户上传表单图片后，可通过语音或文字说明所需填写内容，系统自动识别字段并完成补全。该功能融合图像理解、语音交互与内容生成技术，支持上下文驱动的端到端处理。目前输出为静态图片，暂不支持直接生成可编辑PDF或交互式文档，且依赖上传文件清晰度。部分场景仍需人工复核转录。
智元发布新一代运控基座模型BFM-2
12小时前
分享到:

2026年5月23日，智元公司正式推出二阶段Motion-Between运控基座模型BFM-2。该模型面向具身智能机器人，支持任意初始状态（静态、预设动作或随机输入）下的高稳定性动作插值与动态任务闭环。其核心能力是赋予机器人类似‘肌肉记忆’的自主运动调控能力，显著提升运动鲁棒性与自平衡性能。官方演示显示，搭载BFM-2的机器人可在被放倒后自主站起并快速恢复平衡。此举旨在为具身智能提供更可靠、通用的运动底层支撑。
渣打CEO就AI替代“低价值”人力言论致歉
12小时前
分享到:

2026年5月23日，渣打银行CEO比尔·温特斯就此前称人工智能将替代“低价值”人力的表态向员工致歉。他承认措辞引发部分同事不安，但未撤回关于2030年前削减15%后台岗位（约7800人）的核心计划。该调整旨在以技术与资本优化运营，而非单纯降本。温特斯强调银行正为受影响员工提供转岗培训与技能提升支持，并附上完整发言记录以澄清语境。
星巴克叫停AI库存自动盘点工具：上线9个月，错误频出
13小时前
分享到:

星巴克本周正式终止了其在北美地区门店使用的AI库存自动盘点工具。该系统旨在通过平板电脑拍照自动统计牛奶、糖浆等物料库存，但在上线9个月后因频繁出错而被叫停。

【阿里云】分钟级部署 Hermes/OpenClaw，官方镜像一键部署｜不限流量更省心｜助力低成本部署AI agent