200美元搞定400万美元的项目!YC总裁:同时调用15个Agent,每月交付数十万行代码,Claude Code和Codex协作开发,用Token换时间亿万富翁

200美元搞定400万美元的项目!YC总裁:同时调用15个Agent,每月交付数十万行代码,Claude Code和Codex协作开发,用Token换时间亿万富翁13年没写代码,掌管着全球最顶级创业孵化器 Y Combinator(YC)的 Garry Tan 重新回归开发者身份。

他开启的第一个项目是重写了自己当年花 400 万美元、雇6 个人、18 个月才完成的博客平台。

这一次,他一个人只花了 200 美元,5 天时间。

而这一开源项目在 GitHub 上从零增长到了超过 10 万颗星,在开发的同时他还在全职担任着 YC CEO,承担极高强度的工作。

他到底是如何做到的呢?Garry 近期做客 YC 官方播客,分享了近几个月的 AI coding 或者说 AI Agent 使用的心得。

对于第一个开发项目 Garry List,他靠 Claude Code 和一套 AI Agent 工作流,交付了数十万行代码,同时指挥了 15 个 Agent 一起开发。

而到第二个开发项目 GStack他开始将大量原本需要人类花很长时间才能完成的研究、归纳、交叉比对、测试和调试全都交给了 AI。

在分享这一项目经历时,他详细讲述了自己的一人开发工作流,并提到自己的代码产出量大约是 2013 年的 400 倍。

通过这些项目的开发,他认为人类的意志、审美和反馈会一直在产品开发的回路中,人类不会被 Agent 完全取代。

他还强调,现在的 Markdown 实际是就是代码,重心应该放在它的编写上。要搞清楚“多少逻辑放在 LLM 这边,多少放在代码那边”。LLM 的“潜在空间”负责理解人类复杂的动机,而代码负责确定性的执行。

在这场对话中,他们还聊到个人 AI 将像个人电脑一样普及。

Garry判断,当前的 AI 开发正处于类似 1970 年代“自制电脑俱乐部”的阶段,到明年每个人都将拥有满足自己独特需求的 AI。

与此同时,Token 预算会越来越像房租一样,不再是可省可不省的开销,而是非常重要的必备生产力支出。

此外,“个人化 AI 主权”会变得更重要,人们会越来越在意自己的提示词、数据、工作流和集成环境是否掌握在自己手里,而不是被平台黑箱控制。

在最后,他还提出一个非常新颖的观点:通过 Token 极大化,我们能买下机器或者说 AI 的意识时间,换回自己的时间,也就是我们可以成为时间维度的亿万富翁。

更多精彩观点见以下播客全文,enjoy:

只花 200 美元完成过去 400 万美元的项目,Garry’s List 诞生

主持人:在开始之前,不如我们回顾一下那个开启这一切的项目,也就是 Garry‘s List?

Garry Tan: 哦,是的。

主持人:聊聊几个月前你如何开启 Claude Code 并重新开始编程的。那是在一期《光锥》(the light cone)节目之后,对吧?

Garry Tan: 没错,绝对是。我意识到我想把所有和我有共同信念的人聚集在一起,特别是为了加州。所以我成立了一个 501c4 组织,现在还有了 C3 和一个政治行动委员会(PAC),这是很多政治团体的常规做法。大家通常只关注资金,但我们试图聚集聪明的人。我在旧金山政治圈工作多年学到的是,把人聚集在一起的力量是非常强大的,这就是群众社会运动。我说:“好吧,为什么我不干脆建个网站来开始做这件事呢?” 于是就从我关心的那些问题开始写起。

这就像我希望孩子们能上学一样。全世界看这段视频的人可能会觉得非常奇怪,我也觉得很奇怪,在旧金山的公立学校,七八年级的初中生竟然不能修代数,而且现在依然很难。这关乎数学教育。如果我当年在东湾公立学校读书时没能修代数,我绝对不可能在斯坦福学习工程,不可能写代码,也不可能做成现在的任何事情。所以这件事对我来说非常重要。我意识到该写代码了,我最终重新构建了 Posterous(我 2008 年的第一个 YC 创业项目)。

主持人:对于那些不记得的人来说,Posterous 是做什么的?

Garry Tan: Posterous 是极致简单的邮件博客。它曾成长为全球前 200 的网站,后来被 Twitter 以大约 2000 万美元收购。那算是我赚到的第一桶金。后来因为 Twitter 关停了这个项目,我又把它重写成了 Post Haven。当时从 Twitter 手里买回它要花几百万美元,而我当时根本没钱,所以最好的办法就是重写一遍。

到了今年 1 月,我把它重写了第三遍。第一次开发它花了大约 400 万美元,雇了六七个人,耗时一年半。第二次花了大约 10 万美元,只有我和合伙人 Brett Gibson 两个人,用了大约三个月。而这一次,只花了 200 美元(我的 Claude Code Max 账号费用),大概用了 5 天。它现在是一个功能齐全的博客平台,拥有你想要的一切,而且还集成了完整的 RAG(检索增强生成)和 Agent 检索功能。它能阅读整个互联网,包括我发过的每一条推文,并进行递归爬虫和深度研究。

代数问题只是我们关心的众多问题之一。现在的系统能摄取互联网信息,查看所有支持和反对的论点,然后在后台生成极其详尽的报告。我记得在《光锥》早期节目中,Jake Heller 提到过 Agent 系统。Jake 创建了 CaseText,他描述的功能正是我为这种长篇深度报道所构建的。现在任何人都可以访问 Garryslist.org,我们每天会发布两到三篇关于加州、旧金山和洛杉矶政务的高质量调研文章。

Token 极大化,用 AI 做极致完美研究

主持人:我觉得大家忽略了 Garry‘s List 的一点:以前你构建软件是为了让别人使用,比如建个博客平台让别人写文章;但 Garry‘s List 既是平台,它本身也承担了高质量调查记者的工作。它不仅仅是记者的工具。

Garry Tan: 是的。基本上只需花费 5 到 10 美元的 Opus 调用费,它就能完成一个人类需要耗费数周才能完成的工作,比如研读几十篇文章、阅读整本相关书籍并做注释。回到 CaseText 的例子,Jake 教给我的是:你需要思考人类在给定背景下会做什么。他会检索什么?去图书馆吗?找什么样的书?在网上搜什么?现在最棒的是你不需要亲力亲为,你可以调用 Perplexity 的 API 进行深度研究,或者用 X 和 Grok 的 API。你可以抓取所有的上下文,这回到了我的一篇散文《煮干大海》(Boil the Ocean)的哲学。

特别是在构建 Agent 软件时,我们不必再受限于人类写代码时的那种局限,研究也是如此。如果你能“煮干大海”,也就是做极致的完美主义研究会怎样?如果是一个人做这种研究可能需要一个月,但现在你只需要投入更多算力。你可能会花很多钱买 Token,但这叫“Token 极大化”(Tokenmaxxing)。如果增量的工作能让事情更完整、更出色,那就值得。

Garry Tan: 我们不满足于单一来源,如果有 20 个来源,我们可以进行交叉比对。我们可以发现其中 13 个来源支持某种说法,而另外 7 个持反对意见。然后你把这些上下文全部喂给核心提示词,它就能做出比人类“点击链接、看个标题”更明智的决定。我觉得“Token 极大化”是目前最酷的事情,它不仅能生成文章,显然还能写代码。它将渗透到社会的方方面面,任何被称为“知识工作”的领域都可以进行 Token 极大化。

这并不意味着我们要取代人类。这意味着人类仍然需要提供主体意志(Agency)。比如,我才是那个关心代数的人。我希望像我一样上不起私立学校的孩子能有出路。旧金山是全美私立学校就学率最高的城市之一,这很不公平,你不应该只有富有才能接受良好的教育。这对我来说是刚需。在技术发生剧烈变革的同时,我有一种燃烧的渴望。想到那些想学代数却被官僚阻碍的 10 到 13 岁的孩子,我就感到痛心。

每月交付数十万代码的一人工作流,GStack 诞生

主持人:在通过构建 Garry‘s List 来解决你自身痛点的过程中,你发现了很多关于 Token 极大化和这种新构建方式的模式,这也引导你进入了下一个项目:GStack。

Garry Tan: 实际上我并没计划做 GStack。我只是发现自己一直在重复同样的操作,厌倦了反复输入同样的东西。于是我打开苹果备忘录,把那些经常输入给 Claude Code 的内容记下来。这是非常简单的事情,就像计划评审(plan review)。我开始做的第一件事是,我非常喜欢让 Claude 制作 ASCII 艺术图表。我发现有时候 Claude 会感到困惑,写出 Bug 或者不完整,但一旦我说“在开始工作前,请先画一个包含所有数据流、输入输出、用户路径和错误信息的 ASCII 图表”,它加载了所有上下文后,工作就完成得更出色。

它能更好地“煮干大海”,并拆解成不同的部分,比如这里是架构评审、代码质量、测试。在构建 Garry‘s List 时我学到,以前我自己写代码时总是做最少量的测试,因为那不好玩。虽然我知道测试很重要,但我更想写有趣的新代码。后来我遇到了所有“氛围编程”(Vibe Coding)的人都会遇到的问题:代码变成了“垃圾”(Slop),在 80% 的情况下运行良好,但用户一碰就崩溃。那时候我意识到,我可以实现 100% 的测试覆盖率,虽然现在我觉得 80%-90% 是最佳实践。这就是 plan review 的第一个版本。

我知道很多人都知道 Office Hour Skill,大家都可以使用、我尝试做新产品或新功能时仍会用的 Skill。它模拟了我们与公司合作时所做的事情:你如何知道人们想要这个?它是为谁准备的?有什么影响?这就像 Skill 的雏形,当时我甚至不知道 Skills 的存在。我把它发出来后就火了,有 20 万人看到了它。后来我做了一个更宏大的版本,叫“Mega Plan”,最后改名为“CEO Plan”。

我在这里使用了“元提示词”(Meta-prompting)。我拿出了之前的另一个评审计划(review plan)说:“好吧,我们做一个新版本,但想象一下 Brian Chesky(Airbnb 创始人)正坐在你身边。” Brian 有一段关于“10 星体验”的名言。大家都按三星、四星、五星来评价酒店,但 Brian 会问:“什么是六星、七星、甚至八星体验?”并一直列下去。这是我最喜欢的产研设计练习,就像做心理训练一样。而且最棒的是,现在你可以每次都可以让 AI 这么做,这就是它的意义所在。

你知道,这个提示词会尝试找出事物的“理想型”。其中有两点非常棒:一是“10 倍检查”,即什么方案更具雄心,只需花费 2 倍的努力就能交付 10 倍的价值?所以从潜在空间中无论出现什么推理都能帮助模型真正地可视化。我非常喜欢 plan CEO 这个 Skill,因为我是一个患有 ADHD 的 CEO,我热爱潜能。我不敢相信仅仅两句简单的描述就能解锁如此巨大的能量。GStack 就是这样开始的,我最初并没想把它做成什么,只是想把自己用的 Skill 整理成库。后来我发现,我使用这两个 Skill 的频率太高,甚至导致我的 Conductor 实例都过载了,这就是我真实的设置。

(注:Conductor是一款专门用来并行运行多个 AI 编码 Agent 的 Mac 应用。它能同时启动多个 Claude Code / Codex 等 AI 实例,每个实例在独立的 Git worktree(隔离的工作区)中工作,避免代码冲突。)

主持人:这就是你的日常工作流程。你就是这样每月交付数十万行代码的。所有的一切,都在这里。

双 AI 协作:Claude 是多动症型 CEO,Codex 是高冷 CTO

Garry Tan:是的,没错。在过去的 48 小时里,我提交了大约 13 个 PR(合并请求),你可以把它们排成队列。每当我产生新灵感,我就会回来处理。我非常喜欢使用 CEO Skill,喜欢用它让代码测试得非常充分,这些都是在“计划模式”下完成的。

然后我会点击这里的批准,Claude 就会去执行所有操作。我操作得太频繁了,最后积压了大约 15 个不同的功能等着我手动测试。虽然它通过了端到端测试、集成测试和单元测试,但归根结底,我还是得为 Garry‘s List 打开 Rails 服务器,加载用户,调整到特定配置,手动确认它是否工作。

我烦透了这种手动操作,尝试使用 Claude 里的 MCP(模型上下文协议),但每一轮交互要两三秒,太慢了。我觉得这没法用来做 QA(质量保证),但我听说微软发布了 Playwright,这是一个替代性的测试框架。回想起来,当时其实有 Agent Harness 之类的工具可用,但 Claude Code 的优缺点都在于它太容易上手了,我直接在那写代码。

也许我当时就是这么做的:我受够了在 Chrome MCP 里用 Claude,太慢了,让我们封装一下微软的 Playwright 吧,能行吗?然后我按了回车。GStack 的一个特点随之浮现:这就是我现在开发新功能的方式。当然,现在它会说:“嘿伙计,你已经做过了”,这很有趣。我把 Bug 修复和重大功能并列放在一起。

GStack 的工作方式是:有一个 CEO,一个设计师,甚至还有一个专门负责开发者体验的角色。里面有很多设计工具,最后一步是 Plange。然后我通常运行 /codex(原发音是SLCEX)。最近我在 Codex 里添加了一个 /claude 命令。这是我从 YC 校友那里学到的酷东西,我参加了一个活动,当时大脑完全一片混乱,但我们聚在一起交流 Claude Code 和 Codex 的区别。

当时我是 Claude Code 的死忠粉,但我意识到很多人其实更喜欢 Codex。为什么?我发现 Claude Code 非常适合“多动症型 CEO”,但偶尔它会胡编乱造。Claude 模型虽然很棒,但事实证明它们并非在所有方面都是最聪明的。

很多人向我解释,如果你遇到一个非常疯狂的问题,你需要那个智商 200 且几乎不说话的“高冷 CTO”。所以你可以叫个帮手,这就是 /codex。这是一个GStack 技能,它会根据你的计划或已实现的仓库,在命令行运行 Codex 并提示它“找出所有问题和 Bug”,然后反馈给 Claude Code。

后来我增加了新功能:如果你用 Codex 作为主代理,你可以输入 /claude 让 Claude 临时充当 CEO。GStack 最酷的地方在于,当我运行它时,我总是从 Office Hours 和 CEO review 开始,如果有 UI ,如果我知道有开发者需要使用,就像 GStack 和 GBrain 的几乎所有东西一样,我先进行开发者评审,然后再进行评审。

一旦计划完成并解决了所有问题,GStack 会非常依赖“询问用户”这个环节。对我来说这很重要,因为这是人类、所谓的“氛围编程者”(Vibe Coder)或 Agent 工程师需要提供理解的地方:我们到底在构建什么。这没有替代品。如果有人能做出完全不需要人类参与就能写软件的东西,我会非常惊讶。

虽然这可能是一个有争议的观点,但我永远不想完全脱离这个环节。我只想让机器去做我不想做的事,比如 QA 就是个好例子。回到演示,我在现代版 GStack 里输入内容,它会说:“伙计你在干嘛?我们已经做好了。”我们有 Browse 功能,它是一个带有 70 个命令的 CLI 守护程序,QA 本质上就是浏览器操作。

在 QA 的提示词里,它会查看上下文:我们在这一分支做了什么?如果有 UI 或数据变动,就去用浏览器测试它。这太酷了,就像拥有一个黑盒浏览器。第一次成功运行的时候我被震撼了,感觉“微型 AGI”已经实现了。当然我知道这不是真正的 AGI,真正的 AGI 是我根本不需要在这。但作为开发者,我私心地希望我们永远不需要停止工作。

我希望机器永远不要彻底搞定一切,因为那样才酷。这意味着人类依然重要,那些有审美、能做设计和产品反馈、心里装着真实客户的工程师依然重要。只要我们还在做这些,我们就相当于插上了翅膀。

最近使用 Claude Code 就像开法拉利,但得会动手修理它

主持人:我觉得你在 X 上的那篇关于“薄 Harness、厚 Skills”(Thin Harness, Fat Skills)的帖子里把这些思考具象化了。

Garry Tan: 是的,那篇文章涵盖了如何进行“Token 极大化”的所有哲学。我被互联网上的人无情地嘲讽,说我只是在兜售 Markdown。但我现在的实战经验是:Markdown 实际上就是代码。它只是编译方式不同,但你可以让计算机完成惊人的任务。

甚至可以这样想:我们能想象我现在是在和一个已经取代了 Visual Studio 的东西交谈吗?我根本不用 Visual Studio 了,没理由用,因为我可以和我的代理对话。这篇文章的名字其实来自我们的合伙人 Pete Koomen。我们不得不构建一个内部代理,反复称之为 Harness。

用了一整天 Claude Code 后,我们意识到为什么要一遍遍重写这些东西?我们应该直接使用那些非常棒的 Harness。Harness 是核心循环:接收用户输入、交给 LLM、执行 LLM 的操作(如工具调用)。我们不该把时间花在那些东西上,而应该思考:应该编写什么样的 Markdown?

想象你是一个婚礼策划人,在写一份 checklist 教下一个人如何办婚礼。你应该用平实的英语写下该做什么,这些都应该在 Markdown 里。而那些确定性的操作,比如给 20 个场地打电话,你不会用 Markdown,而是向 Twilio 发起一次调用,这其中就包含了一系列困难

Twilio 是一家美国云计算公司,提供通信平台即服务(CPaaS),帮助开发者通过简单的API快速构建和集成实时通信功能。)

如今 Agent 工程的难点在于,人们试图在代码里实现本该写在 Markdown 里的逻辑,结果失败了,因为代码很脆弱,不理解特殊情况。代码根本不理解你想要什么或你是谁,它只是在执行确定性的 0 和 1。但现在的 LLM 拥有“潜在空间”,它懂你的动机,能处理通用情况。

作为工程师,现在最神奇的事情在于搞清楚:多少逻辑放在 LLM 这边,多少放在代码那边。结合我学到的另一件事:测试覆盖率要达到 80%-90%。如果没有测试就扔给用户,那产出的就是“垃圾”(Slop),比人类写的烂代码还糟糕 10 倍,因为你根本不知道会发生什么。

所以人们必须做的一件事是:不仅要搞清楚潜在空间和确定性空间的界限,还要确保单元测试和集成测试到位。回到“煮干大海”的理念,机器不在乎工作量,它只会去执行。这很神奇,只要投入更多算力,你就能达到 90% 的测试覆盖率。

现在的系统虽然不完美,比如 Claude Code 还有很多失效场景,但已经完成了 95%。我觉得最近使用它就像开法拉利,非常刺激,简直疯狂。它能瞬间理解那些你以为机器永远理解不了的事情。但你也最好是个修理工。因为它可能会在你最需要的时候坏在路边,你得拿着扳手跳下车,掀开引擎盖去修理它。

这在计算机科学史上是一个非常令人兴奋的时刻,因为它就像“自制电脑俱乐部”(Homebrew Computer Club)时代。Apple I 诞生时,只是一个装在木盒里的电路板,用钉子和胶带固定。如果你想要个人电脑,你就得这么干。我们现在就处于这个阶段。

懂技术的、学过计算机科学的人,需要花两三个小时,投入几百上千美元的 Token 和云端费用才能让这套系统跑起来。但一旦跑通,我们就进入了“组装法拉利”阶段:你可以开车去任何地方,你想对着群山呐喊:“嘿,我有一辆法拉利!”

只要能被另一个Agent修复,Agent的脆弱性就不是问题

主持人:关于“自己动手修理”这一点,我觉得除非你亲自尝试过,否则很难理解。放大视角来看,事情进展得太快了。以前遇到编程难题有 Stack Overflow 可以查询就觉得很神奇了,后来有了 ChatGPT 这种比 Stack Overflow 好得多的交互工具,但你还是在做同样的事:提问、复制粘贴代码、运行、看结果、再粘贴回去。

而有了 Claude Code,你发现不需要复制粘贴了,它能直接运行代码。即使是 OpenClaw,虽然设置起来很烦,经常会把自己搞死,做一些莫名其妙的事,但如果你让 Claude Code 去运行它,它能修好它。

Garry Tan: 是的,我就开着 Claude Code,它会直接修好。这显然不是长久之计,但这是一种心态转变:只要你能让另一个代理坐在那一直修复,它的脆弱和需要修理就不再是问题。

我之前完全是 Claude Code 的信徒,现在依然是,但我现在开发产品的时间里,可能只有 50% 到 60% 是在 Claude Code 里,剩下的一半几乎都是通过 OpenClaw 完成的。这很有趣。

不过我大部分时间其实是在做 GBrain。它的诞生是因为我见到了你,我们节目还请到了 Peter。后来某周末我决定研究一下 OpenClaw。当时 Karpathy 正好写了关于 LLM 维基百科知识帖子。

所以我就想:我有一个装满 Markdown 的仓库,我应该把所有上下文都放进去。后来我发现,它只是在用 GP(通用提示),效果并不好,既浪费上下文,加载的内容也远超需求。于是我掉进了“兔子洞”,通过 Conductor 快速启动,并把 GStack 集成进去了。

实际上这个过程更有趣。我并非从零开始。随着你写的代码库越来越大,你的大脑里已经装载了这些内容。比如为了给 Garry‘s List 做一个“代理新闻编辑室”,我必须学习向量嵌入、混合 RRF(倒数排名融合)和分块(Chunking)。当你身处其中尝试解决问题时,你的目标非常明确。

我想要这样的输出,文章必须是这个质量,必须有这些引用。你会据此构建测试和集成测试,最终得到一个基于你期望输出而经过实战检验的产品。我把这些经验整合在一起,这是任何人都能做的。所以我认为我们正在进入开源的黄金时代。

我可以在 Conductor 里打开这个项目,写的第一个指令就是:去看看 Garry‘s List 是怎么做分块、嵌入和 RAG 的,把它提取出来。我想用带 PG Vector 的 Postgres 做一个完整的 RAG 系统给我的 OpenClaw,然后一件事接一件事,最后我开了 10 个窗口和 GBrain 疯狂开搞。

关于 OpenClaw 有个好例子。这是我的 OpenClaw 记录,我问它我是什么时候开始搞的?1月23日。还有你所有的邮件。我发过一条推文:这周的 Claude Code 唤醒了 25 岁的我,那个猛灌红牛、通宵写代码的我。我们回来了,开发者的身份觉醒了。

我基本上回到了每天睡 4 小时、写代码 20 小时的状态。也是在那时,我因为讨论“代码行数”惹了点麻烦。顺便说一句,我依然坚持那个观点。

代码产出量是过去的 400 倍,同时指挥 15 个智能体

主持人:这可以顺便聊聊。用代码行数衡量效率在网上很有争议,反方观点是这不代表开发者的产出。

Garry Tan: 它确实不能完全代表,对吧?但它在某种程度上也能代表。有趣的是,你可以运行一些公开的 Git 脚本,剥离并标准化什么是真正的“逻辑代码行数”。我确实这么做了。我曾说我的代码产出率是 2013 年的 100 倍,并因此遭到抨击。但在我进行了逻辑代码行数统计后,发现这个倍数实际上变得更高了。

结果证明,我处理的代码量确实达到了过去的 400 倍。但显而易见,我并不是在亲手敲代码,而是在同时指挥 15 个智能体去完成工作。从数据上看,Claude Code 并没有怎么精简我的代码量,但令我惊讶的是,它让我实际手写的代码比 2013 年减少了约 70%。

这就是其中的偏差所在:如果是人类写代码,很容易为了“看起来在干活”而注水;但除非你明确指令 Claude Code 去刷行数,否则它不会这么做。它可能会写错,或者你引导得不够好,但它不会像为了完成指标的职场人那样去刻意优化代码行数。

令人惊讶的是,如果你查阅 90 年代到 2000 年关于软件工程的文献,你会发现:一个专业的、经过测试且可投入生产的软件工程师,平均每天产出的代码量并不是几百行,而是 30 到 50 行左右。

主持人:是按天算的吗?

Garry Tan: 对,按天算。对我来说,那时候我兼职写代码,每天可能只有 14 行。这就是 400 倍这个数字的由来。我也意识到,我当时应该直接解释清楚,而不是在网上为了代码行数跟人互怼。如果你在网上被我怼过,我深表歉意。这件事背后有更深刻的逻辑,我也发布了一篇博客来详细解释。

这对技术人员来说意义非凡,因为它拉高了能力的上限。那些攻击我“代码行数论”的人,其实最应该尝试 “Token 极大化”(Token maxxing),因为这能给他们插上翅膀。如果你有审美且懂技术,你才是这项技术最大的受益者。你要做的仅仅是去相信。别争了,直接打开 Claude Code 试试吧。

明年每个人都会拥有个人 AI, 类似个人电脑革命

主持人:还有一个可能的原因是,使用体验会因模型和 Harness 的不同而天差地别。我注意到,任何稍微复杂的编程任务,如果用我自己的 OpenClaw 智能体去跑,基本都会失败。虽然用的模型和 Claude Code 一样(比如 Opus 4.7),但只要超过了简单脚本的范畴,效果就很一般。

当我切回 Claude Code 时,我突然意识到:“哦,这就是那种久违的流畅感。”就像半年前,我们尝试这些工具时总觉得“还没到时候”,但现在配合 Opus 4.5 的 Claude Code 已经让你感觉它几乎要实现自我递归了。

Garry Tan: 现在的感觉是,人们觉得 OpenClaw 或 Hermes 模型还差点火候,或者用起来太累。但我敢保证,明年这时候,每个人都会拥有自己的个人 AI。

我们可以有两种选择:一种是拥有自己的 AI、数据和集成环境,我们自己写提示词,掌控自己看到的内容;另一种是被企业控制,就像 Facebook 的信息流一样,你不知道背后的算法是谁写的,对谁有利,也不知道背后的商业模式是什么。

历史上最伟大的礼物就是个人电脑革命,而我们即将经历一场完全相同的个人 AI革命。这将是一个选择:你是否愿意编写自己的提示词?正如 Pete Koomen 教给我们的:除非你拥有并能编写自己的提示词,否则你永远活在某个产品经理或开发者的 API 规则之下,而那个人根本不了解你,不了解你的独特需求和关注点。

核心问题在于:是你掌控工具,还是工具掌控你?公众现在还没意识到这一点,因为目前要发挥这些能力,你必须使用最先进、昂贵的模型,烧掉大量的 Token。

AGI 的核心就是要消耗大量 Token

主持人:没错。我们要承认,这种类似 ASI/AGI(通用人工智能) 的构建方式,核心就是需要消耗大量 Token。

这让我想起了旧金山的房租。我们总会对 YC 的创始人说:不要因为嫌贵就不搬来旧金山,因为不在这里生活的隐形代价更高。

Garry Tan: 没错,这正是关键所在。

主持人:在 YC 早期阶段,创始人会觉得一个月花几千美金租个公寓太离谱了。但事实上,你绝对应该付这笔钱,甚至应该付更多钱住在 Dogpatch 这种社区,以此创造“意外的成功”(Serendipity)。我们要教会创始人:“Token 极大化”也是同样的道理,虽然直觉上觉得该省,但实际上它是像房租一样的生产力支出。

你应该尽可能多地投入预算来榨取最大效用,而不是把它当成办公桌或沙发之类的耗材去节省。在模型和 Token 消耗上,你应该拼尽全力。

Garry Tan: YC 的核心准则之一是:如何发现好的创业点子?“生活在未来,并构建缺失的部分。” 这是一个深刻的版本:你只需要在脑子里转个弯,接受一天花 500 美元烧 Token 的设定。只要我在构建对自己有巨大价值的东西,只要方向正确,我就应该这么做。

用 Token 买回时间,让自己成为“时间亿万富翁”

主持人:Garry,我有个奇怪的问题:你身为YC 的 CEO,在极度缺乏时间的情况下尝试构建这一切,是否反而帮了你?因为你的时间太稀缺了,你必须在会议间隙的碎片时间里搞定几十万行代码。你不能像全职工程师那样慢慢调试,这种稀缺性迫使你必须实现全自动化。

Garry Tan: 我非常嫉妒那些 “时间亿万富翁”。看着我的孩子,他们现在就是时间亿万富翁。在 Startup School,我们也常遇到这样的人。你能学习任何东西,这太棒了。

就我个人而言,我的大脑总是处于极度的紧迫感中。我感觉自己像是活了 100 亿次才换来这一世的肉身,我必须让每一秒都有意义。如果你能做到 Token 极大化,你就能买下“机器意识”的数百万年意识时间。

这样我也可以成为时间亿万富翁。这不是我自己的时间,而是机器在为我工作,为我关心的事业(比如 YC,比如让开发者能更自由地构建)去努力。

在去年的内部会议和团建中,我们一直在讨论如何教下一代使用这些工具。我希望我能说这一切都是宏大计划的一部分,但事实并非如此。它是潜意识驱动的。

通过做《光锥》(Lite Cone)播客,和坐在我身边的 Boris Churnney 交流,我意识到他说的某些事我也能做。当他说“我们的团队不写一行代码”时,我想:“哦,其实我也行。”

屏幕前的各位和我并没有什么不同。我们起点相同。尽管别人把我捧得很高,但我只是个想做成点事儿的普通人。Boris 是我见过最顶尖的工程师,但当我打开提示词框时,我们的工具是一样的,电脑是一样的。只要愿意投入 Token 来服务人类,你我之间没有任何隔阂。

主持人:Garry,这句太经典了,绝对值得发在X 上:“你可以通过借用机器的时间,来获得无限的时间。”

Garry Tan: 没错。能活在这样一个时代,真是太好了。

主持人:这是一个完美的结语。感谢 Garry 为我们展示未来。

Garry Tan: 谢谢大家。

本文来自转载51CTO技术栈 ,不代表发现AI立场,如若转载,请联系原作者;如有侵权,请联系编辑删除。

(0)
资讯组小编的头像资讯组小编
OpenClaw终于长出手和眼!Peter正式发布Peekaboo v3,一日三更
上一篇 2小时前
360在内部发出全员信,宣布向全体员工每人发放1亿Token
下一篇 1小时前



扫码关注我们,了解最新AI资讯~

相关推荐

发表回复

登录后才能评论