Opus 4.8编程能力不如GPT-5.5

资讯组小编 • 文章来源: 刘小排r • 2026年5月30日上午2:01 • 评测

哈喽，大家好，我是刘小排。

从凌晨Opus 4.8发布到现在，我一直在真实任务中使用，今天已经累计消耗了超过618美金，8.4亿Token。

Opus 4.8编程能力不如GPT-5.5

我的结论：

Opus 4.8编程能力仍然不如GPT-5.5，但是差距不大
Anthropic已经连续两个版本编程能力不如GPT，别看它现在估值比OpenAI高，三个月内，OpenAI的估值一定会反超回来！

Artificial Analysis是一个相对客观、较难刷分的测评，它在Coding Index (编程能力排行）也给出了和我一样的结论。

真实编程能力，Opus 4.8不如GPT-5.5，甚至不如GPT-5.4。 Opus 4.8编程能力不如GPT-5.5

但Opus 4.8并非一无是处，今天重度实测发现，以下是它胜过GPT-5.5的地方

1M上下文窗口，只要在1M之内，都不会降智、不会丢信息。我的很多知识库和文档类工作，Opus是我的主力。
Opus 4.8的前端编程能力远超GPT-5.5，无论是审美还是逻辑。我们一句话让Opus 4.8做出来非常不可思议的3D动画，全前端实现，连Gemini 3.5 Flash都做不到的那种。
超长任务、复杂工作流，表现得比GPT-5.5更稳，尤其是召唤N个Sub Agent的场景。不会目标漂移。
更容易承认自己不知道，更少瞎编。
脑洞大，更适合头脑风暴。

因此我的整体结论是： Opus 4.8适合做CEO，GPT-5.5适合做CTO，两个配合起来用才是正解。

明天我打算玩一玩Claude Claude随着Opus 4.8一起发布的dynamic workflow功能，看看是否会有惊喜。

比较奇怪的是，这次Opus 4.8的发布是把Workflow功能当成重点来讲的，号称可以召唤数百个Sub Agent来协同，可是等了一整天，全世界的网友目前真正用起来的都很少。(我是指在实际工作中用起来，不是自媒体博主吹牛逼、用AI把官方文档翻译一遍，就开始教你怎么用那种）

如果你知道什么场景适合玩dynamic workflow，请告诉我，我来实操。

本文来自转载刘小排r ，观点仅代表作者本人，发现AI平台仅提供信息存储空间服务。
如若转载，请联系原作者；如有侵权，请联系编辑删除。

Opus 4.8Claude Opus 4.8发布

赞 (0)

资讯组小编

微信扫一扫

微信扫一扫

Claude Opus 4.8 测评

Claude Opus 4.8 测评

上一篇 2026年5月29日下午11:15

苹果用AI重新发明了图像压缩：同样画质，文件只要三分之一

苹果用AI重新发明了图像压缩：同样画质，文件只要三分之一

下一篇 2026年5月30日上午11:59

扫码关注我们，了解最新AI资讯~

评测

国产AI编程冲上全球第二，实测五大模型，谁才是Vibe Coding神器

评测组小编
2026年5月28日
新闻

给4个模型各发20美元“做播客”：谁赚钱了、谁离职了？

评测组小编
2026年5月18日
评测

火山剧创1.0评测：该说的不该说的，都在这了

评测组小编
2026年5月23日
评测

AI接管浏览器！实测Codex Chrome：简单任务翻车，复杂任务反而成了

评测组小编
2026年5月9日
评测

实测DeepSeekV4：天下武功，唯快不破

评测组小编
2026年4月24日
评测

行业首创空间3D显示，还能主动提醒和帮忙叫车，千问AI眼镜这操作真把我看愣了

评测组小编
2026年5月9日

发表回复

登录后才能评论

智谱：英文名称变更为Z.AI Co., Ltd.
2小时前
分享到:

智谱在港交所公告，英文名称已由Knowledge Atlas Technology Joint Stock Company Limited变更为Z.AI Co., Ltd.。本公司的中文名称“北京智谱华章科技股份有限公司”将维持不变。
阿里云：下调GLM-5.2 Fast mode模式价格
2小时前
分享到:

阿里云宣布，大模型服务平台百炼将于北京时间2026年7月15日00:00:00起，对GLM-5.2模型的Fastmode模式计费单价进行下调调整。
西湖大学与达摩院发布AI模型“归元”预测干细胞命运
6小时前
分享到:

2026年7月14日，西湖大学与阿里巴巴达摩院联合发布AI模型“归元”，用于预测干细胞重编程路径。该模型基于25种谱系调控因子（17种小分子+8种蛋白）构建的近400万种组合扰动数据集，采用双模态编码与可解释性设计，不仅预测最优组合，还能关联已知生物学通路。实验验证成功获得高质量、稳定传代50代的下胚层样干细胞，分子特征高度接近天然细胞。成果有望推动早期胚胎发育研究、体外造血及细胞治疗发展。
Claude Code初始Token消耗为OpenCode的4.7倍
6小时前
分享到:

7月12日，科技媒体Systima发布对比测试报告。测试在相同提示词与Claude Sonnet 4.5模型下进行，对象为Claude Code 2.1.207和OpenCode 1.17.18。结果显示，Claude Code处理用户请求前平均消耗约32800 Tokens，OpenCode仅约6900 Tokens，前者达后者的4.7倍。主因在于Claude Code默认加载27个工具说明（占24000 Tokens）及冗长系统提示；而OpenCode仅含10个工具说明，关闭工具后系统提示仅约2000 Tokens。高初始负载显著压缩有效上下文空间。
孙正义：2040年前AI年投资需5万亿美元
6小时前
分享到:

2026年7月14日，软银集团CEO孙正义在东京年度企业大会上表示，为支撑AI发展，到2040年全球每年需投入约5万亿美元（约合33.94万亿元人民币）。他驳斥AI泡沫论，称其“荒谬至极”。软银已向OpenAI累计投资超600亿美元，并大力布局数据中心与机器人领域。孙正义预测，届时AI将占全球GDP的20%，数据中心耗电达3太瓦，能源将逐步转向核聚变。他还提出2040年将有100万亿个AI智能体主导社会运行。
公司擅用离职员工声音做AI配音杭州一公司被判侵权赔2万
7小时前
分享到:

杭州滨江区法院公布一起AI声音侵权判例，一家文化公司拿离职员工录制的声音素材训练AI，合成音色商用，最终被认定侵犯员工声音相关人格权益。原告周某之前在这家公司做虚拟艺人，在职时公司以内部测试为由，让他录制大量声音素材。2024年9月周某离职，之后偶然发现，公司早已用他的录音训练AI模型，合成出来的声音给虚拟角色梦某配音，广泛用在直播、商场大屏、线上商品宣传等盈利场景。周某随即起诉，要求企业立刻停止使用、赔偿10万元损失，同时书面赔礼道歉。
高德发布通用世界模型工坊ABot-World Studio
10小时前
分享到:

近日，阿里巴巴集团旗下高德正式发布通用世界模型工坊ABot-World Studio，并同步开放测试。该工坊将交互式视频生成与3DGS场景生成统一在同一产品中——用户只需输入一段文字或一张图片，即可生成一个可实时交互、任意分享的AI世界，输出结果可保存为视频与3DGS文件。
荣耀与阿里将开展AI智能体终端合作
10小时前
分享到:

荣耀将于7月18日在2026世界人工智能大会举办“从数字屏幕到具身智能——物理世界新范式”分论坛。除之前已官宣的世界著名科技未来学家凯文·凯利外，阿里巴巴集团副总裁、ATH事业群Token Foundry多模态交互负责人许主洪的加入，也引发了业界对后续各方合作的猜想。记者从荣耀和阿里内部渠道获悉，双方将官宣重磅合作，联手方向极有可能是下一代终端操作系统 Agentic OS 的落地实践。据此前公开消息，本次论坛将聚焦AI的智能度和生命感，探讨从“工具”到“伙伴”的 Agentic OS 趋势演进。
纳德拉警告AI企业正借模型窃取客户商业机密
13小时前
分享到:

2026年7月12日，微软CEO纳德拉在博客中指出，企业使用专有AI模型时，正无意间向供应商泄露核心业务知识。他强调，客户支付token费用的同时，更以敏感数据和交互反馈为代价‘二次付费’。模型通过提示词、工具调用及纠错持续学习企业运营逻辑，形成难以复制的竞争优势。纳德拉呼吁允许企业对商用AI模型开展‘蒸馏’研究，打破供应商单向数据攫取的不对等局面，并批评其服务条款中保留客户数据学习权的做法违背公平原则。
美国光伏巨头Sunrun进军“卖算力”赛道，CEO声称用户每月能挣数百美元
13小时前
分享到:

美国最大住宅光伏和储能设备供应商Sunrun正在推进所谓的“分布式AI数据中心”试点，公司首席执行官玛丽·鲍威尔周一表示，对于参加这项计划的用户而言，每个月有可能靠卖算力获得数百美元。据悉，Sunrun在美国有超过100万名已经部署屋顶光伏系统的用户。面对AI产业挥舞支票疯狂追求算力，光伏公司看到了“卖铲子”的机会。

【腾讯云】 4核4G服务器新客 38元/年起，支持 OpenClaw/Hermes 等热门镜像；Token Plan 低至28元/月，多种主流模型极速调用