GPT-5.5
-
花1500美元,让AI“黑”自己的App:GPT-5.5成功率70%,部分模型0分交卷
一个专门为 AI 设计的“Bug 靶场”。 大模型会写代码已经不是什么新鲜事了。但如果给它们一个真实的移动应用、一份 APK 安装包以及有限的预算,它们能否像安全研究员一样主动发现…
-
GPT-5.5彻底击穿300个黑客评测任务,仅需5000万Token!
GPT-5.5 把进攻性网络安全最难的 7 个基准全部打穿,92.4% 正确率,评估体系直接失灵。AI 黑客能力每 6 个月翻一倍,而衡量它有多危险的尺子,已经先被干碎了。 316…
-
GPT-5.5反杀Claude登顶,AI编码旧榜不准了?
【导读】一个号称「零污染」的新基准 DeepSWE,用113道原创题撕开了旧编程榜单的遮羞布。 代码评测圈,一把新量尺落下。 就在刚刚,Datacurve推出了新基准DeepSWE…
-
实锤!GPT-5.5「降智」被抓,OpenAI官方文档认了
GPT-5.5被扒出「假思考」,用两小时就被偷偷换成mini,200美元月费买了个「薛定谔的脑子」。Trace命令实锤,官方文档亲自认领。往后有纷纷吐槽:OpenAI,你糊弄谁呢?…
-
Gemini 3.5 Flash vs GPT 5.5 实测,全网首发!
昨天,想必大家都被 Google IO 大会刷屏了。 大家期待已久的 Gemini 3.5 Flash,终于走到台前了。 Google 官方给了它三个关键词:智能、速度、长链路能力…
-
曝GPT-5.5用上「全球最快芯片」,Claude慌了!
120B模型飙到2000 token/秒,CFO更放话已在跑GPT-5.5!Cerebras 560亿美元IPO首日暴涨68%,但SemiAnalysis万字拆解直指死穴。 Sem…
-
GPT-5.5全球首破!0源码盲写程序,编程AI进入新纪元
全网AI交白卷的地狱级基准,被GPT-5.5拿下一血!开局0源码盲写程序,拉满推理算力直接满血通关。传统代码测试已废,通往ASI的算力狂飙正式打响。 「地狱级」编程难题,终于被AI…
-
奥特曼亲封GPT-5.5「自闭天才」!16人团队连夜退订Claude
奥特曼亲口盖章,GPT-5.5是个「自闭天才」。16人团队连夜退订Claude,换GPT-5.5月省3.2万刀。Codex单周狂飙9000万下载大虐对手12倍,开发者大迁徙开始了。…
-
5月5日5点55分,GPT-5.5自己选客人开派对!Codex反超Claude Code
新智元报道 编辑:定慧 【新智元导读】5月5日下午5:55,GPT-5.5要给自己办场party——时间是GPT-5.5自己挑的,客人由Codex从推文回复里挑。这场看起来像段子的…
-
体验完4月最强的三个模型:跑分涨了,却不说人话了
四月真是如风驰电掣:Anthropic 发布了 Opus 4.7,OpenAI 发布了 GPT 5.5,最后,DeepSeek 更新了暌违已久的 V4。 三家公司的发布通稿读起来都…
-
GPT-5.5实测:更聪明,也更爱“说谎”
4月23日,OpenAI发布新一代旗舰模型GPT-5.5,并在其官网写道,是其迄今为止最智能、最直观易用的模型,也是在计算机上完成工作的新方式的下一步。 这一发布迅速引发行业关注,…
-
DeepSeek-V4和GPT-5.5第一波实测对决,结果出人意料
编辑:Aeneas KingHZ 昨夜,GPT-5.5果然按期发布了,全网没有白等。更炸裂的是,就在同一天,DeepSeek-V4紧随其后发布了!实测后,结果出人意料。 2026年…
