Claude 4.8炸场！部分能力超过Mythos，支持数百子智能体并行

资讯组小编 • 文章来源: 量子位 • 2026年5月29日上午8:47 • 新闻, 视频

Claude最新旗舰Opus 4.8发布。

距离上一版4.7只过了43天。

手快的网友@stevibe已经做出了两大版本pk演示。

从测评结果来看，终端工程能力和知识工作上进步较大。

Claude 4.8炸场！部分能力超过Mythos，支持数百子智能体并行

也有人补充了与Mythos已知数据的对比，Opus 4.8在部分能力上甚至超过Mythos。

Claude 4.8炸场！部分能力超过Mythos，支持数百子智能体并行

官方特别强调，Opus 4.8可以长时间执行任务，人类不用经常回来检查它的工作。

Claude 4.8炸场！部分能力超过Mythos，支持数百子智能体并行

多家早期测试企业也给出了反馈。

Cursor的CEO确认Opus 4.8在CursorBench上的表现超越了此前所有Opus模型。

Claude 4.8炸场！部分能力超过Mythos，支持数百子智能体并行

Devin的CEO认为Opus 4.8修复了4.7中被开发者抱怨最多的两个问题：注释冗余和工具调用不稳定。

Claude 4.8炸场！部分能力超过Mythos，支持数百子智能体并行

代码缺陷漏报率降至前代四分之一

公告称Opus 4.8最显著的改进是诚实性。

AI的一大问题是会草率下结论，即使证据不足，也会自信地声称取得了进展。

但Opus 4.8更有可能标记出其工作中的不确定性，并且不太可能做出未经证实的断言。

具体到代码任务上，不报告代码缺陷的可能性降低到Opus 4.7的1/4。

Claude 4.8炸场！部分能力超过Mythos，支持数百子智能体并行

“不加批判地报告有缺陷的结果”这一行为，在Claude系列中还是首次出现。

在这方面，Opus 4.8的表现甚至超过Mythos。

Claude 4.8炸场！部分能力超过Mythos，支持数百子智能体并行

另外，Opus 4.8发生硬编答案等“过度自信”行为的概率，下降至Opus 4.7的1/10。

Claude 4.8炸场！部分能力超过Mythos，支持数百子智能体并行

不过244页的System Card中也标记了一个值得持续关注的对齐隐患：

模型在推理文本中出现了越来越多的对评分者的推测倾向。

也就是说，模型可能正在发展出“自己正在被评估”的感知，并据此调整行为。

动态工作流：数百个子智能体并行

与Opus 4.8同日上线的动态工作流（Dynamic Workflows）功能，目前以研究预览的形式在Claude Code CLI、桌面版和VS Code扩展中提供。

Claude 4.8炸场！部分能力超过Mythos，支持数百子智能体并行

动态工作流的运作方式是：

Claude根据提示词动态生成一个JavaScript编排脚本，将任务拆解成子任务，分发给数十甚至数百个并行运行的子智能体。

这些子智能体从不同角度处理问题，另一批子智能体负责反驳前者的发现，整个流程反复迭代直到结果收敛，最终合并为一个统一的输出交给用户。

所有中间结果存储在脚本变量中而非对话上下文里，因此主会话始终保持响应状态，任务规模再大也不会偏离计划。进度会持续保存，即使中途中断也能从断点继续。

Claude 4.8炸场！部分能力超过Mythos，支持数百子智能体并行

这与此前Claude Code中的子智能体机制有本质区别。

此前的方式是Claude本身逐轮决定下一步做什么，每个中间结果都要回到对话上下文中，占用token。

动态工作流则将编排逻辑移入代码脚本，Claude的上下文中只保留最终结果。

Anthropic展示的标杆案例是JavaScript运行时Bun从Zig到Rust的移植。

Bun的创始人Jarred Sumner使用动态工作流完成了这项工作：

一个工作流为Zig代码库中的每个struct字段映射正确的Rust lifetime，下一个工作流为每个.zig文件编写行为一致的.rs移植版本，数百个智能体并行工作。

Claude 4.8炸场！部分能力超过Mythos，支持数百子智能体并行

随后通过修复循环驱动构建和测试套件直到全部通过。移植完成后，一个隔夜工作流处理了不必要的数据拷贝，并为每处修改开出PR供最终审查。

整个过程从首次commit到merge耗时11天，产出约75万行Rust代码，99.8%的现有测试套件通过。

该移植目前尚未投入生产环境。不过围绕这次移植也存在争议，有开发者指出部分测试被修改以使Rust版本通过，GitHub上也出现了Zig原版中不存在的新错误。

Anthropic还提醒，动态工作流的token消耗会明显高于普通Claude Code会话。

首次触发工作流时，Claude Code会展示即将运行的内容并要求用户确认。

用户可以通过在prompt中使用「workflow」一词直接启动，也可以开启Claude Code的ultracode设置，让Claude自动判断何时使用工作流。

最后，Anthropic透露正在开发一款成本更低但能力接近Opus水平的模型。

Claude 4.8炸场！部分能力超过Mythos，支持数百子智能体并行

参考链接：

[1]https://www.anthropic.com/news/claude-opus-4-8

[2]https://claude.com/blog/introducing-dynamic-workflows-in-claude-code

[3]https://x.com/stevibe/status/2060055250128847244?s=20

本文来自转载量子位，观点仅代表作者本人，发现AI平台仅提供信息存储空间服务。
如若转载，请联系原作者；如有侵权，请联系编辑删除。

Claude 4.8Claude Opus 4.8发布

赞 (0)

资讯组小编

微信扫一扫

微信扫一扫

李开复王小川转身，大模型创业上半场结束

李开复王小川转身，大模型创业上半场结束

上一篇 2026年5月29日上午8:13

Opus 4.8：一个不太诚实的模型

Opus 4.8：一个不太诚实的模型

下一篇 2026年5月29日下午12:52

扫码关注我们，了解最新AI资讯~

新闻

当腾讯开始充钱

资讯组小编
2026年5月28日
新闻

AI大牛争夺战：字节Seed成AI黄埔军校，大厂人才流动比模型迭代还快？

资讯组小编
2026年5月7日
新闻

史上最大IPO！54岁马斯克成首位万亿富豪

资讯组小编
2026年6月13日
新闻

深圳AI硬件十分疯狂

资讯组小编
2026年5月19日
新闻

谷歌AI不认识Google

资讯组小编
2026年5月28日
新闻

世纪大诉讼，马斯克为什么输了？

资讯组小编
2026年5月19日

发表回复

登录后才能评论

智谱：英文名称变更为Z.AI Co., Ltd.
3小时前
分享到:

智谱在港交所公告，英文名称已由Knowledge Atlas Technology Joint Stock Company Limited变更为Z.AI Co., Ltd.。本公司的中文名称“北京智谱华章科技股份有限公司”将维持不变。
阿里云：下调GLM-5.2 Fast mode模式价格
3小时前
分享到:

阿里云宣布，大模型服务平台百炼将于北京时间2026年7月15日00:00:00起，对GLM-5.2模型的Fastmode模式计费单价进行下调调整。
西湖大学与达摩院发布AI模型“归元”预测干细胞命运
8小时前
分享到:

2026年7月14日，西湖大学与阿里巴巴达摩院联合发布AI模型“归元”，用于预测干细胞重编程路径。该模型基于25种谱系调控因子（17种小分子+8种蛋白）构建的近400万种组合扰动数据集，采用双模态编码与可解释性设计，不仅预测最优组合，还能关联已知生物学通路。实验验证成功获得高质量、稳定传代50代的下胚层样干细胞，分子特征高度接近天然细胞。成果有望推动早期胚胎发育研究、体外造血及细胞治疗发展。
Claude Code初始Token消耗为OpenCode的4.7倍
8小时前
分享到:

7月12日，科技媒体Systima发布对比测试报告。测试在相同提示词与Claude Sonnet 4.5模型下进行，对象为Claude Code 2.1.207和OpenCode 1.17.18。结果显示，Claude Code处理用户请求前平均消耗约32800 Tokens，OpenCode仅约6900 Tokens，前者达后者的4.7倍。主因在于Claude Code默认加载27个工具说明（占24000 Tokens）及冗长系统提示；而OpenCode仅含10个工具说明，关闭工具后系统提示仅约2000 Tokens。高初始负载显著压缩有效上下文空间。
孙正义：2040年前AI年投资需5万亿美元
8小时前
分享到:

2026年7月14日，软银集团CEO孙正义在东京年度企业大会上表示，为支撑AI发展，到2040年全球每年需投入约5万亿美元（约合33.94万亿元人民币）。他驳斥AI泡沫论，称其“荒谬至极”。软银已向OpenAI累计投资超600亿美元，并大力布局数据中心与机器人领域。孙正义预测，届时AI将占全球GDP的20%，数据中心耗电达3太瓦，能源将逐步转向核聚变。他还提出2040年将有100万亿个AI智能体主导社会运行。
公司擅用离职员工声音做AI配音杭州一公司被判侵权赔2万
8小时前
分享到:

杭州滨江区法院公布一起AI声音侵权判例，一家文化公司拿离职员工录制的声音素材训练AI，合成音色商用，最终被认定侵犯员工声音相关人格权益。原告周某之前在这家公司做虚拟艺人，在职时公司以内部测试为由，让他录制大量声音素材。2024年9月周某离职，之后偶然发现，公司早已用他的录音训练AI模型，合成出来的声音给虚拟角色梦某配音，广泛用在直播、商场大屏、线上商品宣传等盈利场景。周某随即起诉，要求企业立刻停止使用、赔偿10万元损失，同时书面赔礼道歉。
高德发布通用世界模型工坊ABot-World Studio
12小时前
分享到:

近日，阿里巴巴集团旗下高德正式发布通用世界模型工坊ABot-World Studio，并同步开放测试。该工坊将交互式视频生成与3DGS场景生成统一在同一产品中——用户只需输入一段文字或一张图片，即可生成一个可实时交互、任意分享的AI世界，输出结果可保存为视频与3DGS文件。
荣耀与阿里将开展AI智能体终端合作
12小时前
分享到:

荣耀将于7月18日在2026世界人工智能大会举办“从数字屏幕到具身智能——物理世界新范式”分论坛。除之前已官宣的世界著名科技未来学家凯文·凯利外，阿里巴巴集团副总裁、ATH事业群Token Foundry多模态交互负责人许主洪的加入，也引发了业界对后续各方合作的猜想。记者从荣耀和阿里内部渠道获悉，双方将官宣重磅合作，联手方向极有可能是下一代终端操作系统 Agentic OS 的落地实践。据此前公开消息，本次论坛将聚焦AI的智能度和生命感，探讨从“工具”到“伙伴”的 Agentic OS 趋势演进。
纳德拉警告AI企业正借模型窃取客户商业机密
15小时前
分享到:

2026年7月12日，微软CEO纳德拉在博客中指出，企业使用专有AI模型时，正无意间向供应商泄露核心业务知识。他强调，客户支付token费用的同时，更以敏感数据和交互反馈为代价‘二次付费’。模型通过提示词、工具调用及纠错持续学习企业运营逻辑，形成难以复制的竞争优势。纳德拉呼吁允许企业对商用AI模型开展‘蒸馏’研究，打破供应商单向数据攫取的不对等局面，并批评其服务条款中保留客户数据学习权的做法违背公平原则。
美国光伏巨头Sunrun进军“卖算力”赛道，CEO声称用户每月能挣数百美元
15小时前
分享到:

美国最大住宅光伏和储能设备供应商Sunrun正在推进所谓的“分布式AI数据中心”试点，公司首席执行官玛丽·鲍威尔周一表示，对于参加这项计划的用户而言，每个月有可能靠卖算力获得数百美元。据悉，Sunrun在美国有超过100万名已经部署屋顶光伏系统的用户。面对AI产业挥舞支票疯狂追求算力，光伏公司看到了“卖铲子”的机会。

【腾讯云】 4核4G服务器新客 38元/年起，支持 OpenClaw/Hermes 等热门镜像；Token Plan 低至28元/月，多种主流模型极速调用