GPT-5.5

新闻

GPT-5.5突遭暗中降智，思考一到516就断！越难越翻车

GPT-5.5大翻车，竟被数字「516」活活卡死。80%复杂推理被悄悄截断，开发者怒轰OpenAI暗中阉割算力：花最贵的钱，买最烂的体验！简直太诡异了。 OpenAI当家王牌GP…

资讯组小编
2026年7月5日
新闻

一杯拿铁3毛8，Gemini 3.1联手GPT-5.5干黄咖啡馆！2个月烧光21万

顾客编了个假折扣，AI秒批。有人直说「我就是来白嫖」，AI照样免单。Gemini全权经营一家真咖啡馆，两个月账上只剩四分之一。斯德哥尔摩，Norrbackagatan街，一家不到…

资讯组小编
2026年7月2日
评测

“智能体最后的考试”，Fable 5竟然不敌GPT 5.5

没想到打脸来得如此之快！！刚刚，UC伯克利放出了一场号称“智能体最后的考试”的全新基准测试。它把当今最强的AI Agent们拉到考场上，让它们干真正的活—— 在Siemens …

评测组小编
2026年6月12日
评测

花1500美元，让AI“黑”自己的App：GPT-5.5成功率70%，部分模型0分交卷

一个专门为 AI 设计的“Bug 靶场”。大模型会写代码已经不是什么新鲜事了。但如果给它们一个真实的移动应用、一份 APK 安装包以及有限的预算，它们能否像安全研究员一样主动发现…

评测组小编
2026年6月4日
新闻

GPT-5.5彻底击穿300个黑客评测任务，仅需5000万Token！

GPT-5.5 把进攻性网络安全最难的 7 个基准全部打穿，92.4% 正确率，评估体系直接失灵。AI 黑客能力每 6 个月翻一倍，而衡量它有多危险的尺子，已经先被干碎了。 316…

资讯组小编
2026年5月28日
新闻

GPT-5.5反杀Claude登顶，AI编码旧榜不准了？

【导读】一个号称「零污染」的新基准 DeepSWE，用113道原创题撕开了旧编程榜单的遮羞布。代码评测圈，一把新量尺落下。就在刚刚，Datacurve推出了新基准DeepSWE…

资讯组小编
2026年5月27日
新闻

实锤！GPT-5.5「降智」被抓，OpenAI官方文档认了

GPT-5.5被扒出「假思考」，用两小时就被偷偷换成mini，200美元月费买了个「薛定谔的脑子」。Trace命令实锤，官方文档亲自认领。往后有纷纷吐槽：OpenAI，你糊弄谁呢？…

资讯组小编
2026年5月27日
评测

Gemini 3.5 Flash vs GPT 5.5 实测，全网首发！

昨天，想必大家都被 Google IO 大会刷屏了。大家期待已久的 Gemini 3.5 Flash，终于走到台前了。 Google 官方给了它三个关键词：智能、速度、长链路能力…

评测组小编
2026年5月22日
新闻

曝GPT-5.5用上「全球最快芯片」，Claude慌了！

120B模型飙到2000 token/秒，CFO更放话已在跑GPT-5.5！Cerebras 560亿美元IPO首日暴涨68%，但SemiAnalysis万字拆解直指死穴。 Sem…

资讯组小编
2026年5月18日
新闻

GPT-5.5全球首破！0源码盲写程序，编程AI进入新纪元

全网AI交白卷的地狱级基准，被GPT-5.5拿下一血！开局0源码盲写程序，拉满推理算力直接满血通关。传统代码测试已废，通往ASI的算力狂飙正式打响。「地狱级」编程难题，终于被AI…

资讯组小编
2026年5月13日
新闻

奥特曼亲封GPT-5.5「自闭天才」！16人团队连夜退订Claude

奥特曼亲口盖章，GPT-5.5是个「自闭天才」。16人团队连夜退订Claude，换GPT-5.5月省3.2万刀。Codex单周狂飙9000万下载大虐对手12倍，开发者大迁徙开始了。…

资讯组小编
2026年5月11日
新闻

5月5日5点55分，GPT-5.5自己选客人开派对！Codex反超Claude Code

新智元报道编辑：定慧【新智元导读】5月5日下午5:55，GPT-5.5要给自己办场party——时间是GPT-5.5自己挑的，客人由Codex从推文回复里挑。这场看起来像段子的…

资讯组小编
2026年5月5日

1 / 2
1
2

北京：将布局建设Token工厂，力争下半年新增智能算力5万P
7小时前
分享到:

从北京市经信局获悉，上半年，全市数字经济增加值增速7.8%，其中数字经济核心产业增加值增速9.8%，对全市GDP增长的带动作用显著。下半年，北京将推进人工智能全域赋能，推动智能翻译、智能同传等在文旅消费领域的应用。制定Token经济发展政策，围绕Token生产、分发和应用等关键环节，布局建设Token工厂、Token分发平台，推动在工业、教育、文旅等重点领域创新应用。举办“创赢未来”OPC专场路演活动，激发超级个体的人工智能应用与创作活力。开发面向OPC的AIGC培训精品课程，释放AIGC技术价值。依托开源芯片研究院、北京通明湖信息技术应用创新中心，打造“RISC-V+AI OS”开源开放生态，构建从芯片指令集到操作系统到智能体应用的全栈自主技术体系。进一步提升智能算力供给能力。打造“超级节点+行业节点”支撑体系，力争下半年新增智能算力5万P，年内算力总规模突破13万P。
微软与Mistral扩大AI合作，签署数十亿美元欧洲AI基础设施协议
7小时前
分享到:

微软与法国人工智能初创公司Mistral AI于7月21日宣布扩大双方战略合作，围绕欧洲AI基础设施建设达成一项价值数十亿美元的协议，以提升欧洲地区AI计算能力。根据协议，微软将利用Mistral扩大的欧洲GPU基础设施，为其云计算和AI服务提供支持。该基础设施将基于数千颗英伟达Vera Rubin GPU。产品方面，Mistral Medium 3.5和OCR 4模型现已接入微软Foundry平台，Mistral Medium 3.5同时加入Microsoft Copilot Studio，可用于智能体应用、文档处理流程及行业定制化工作流。此外，双方将通过Azure和Azure Local扩展AI部署方式，支持云端、云连接以及完全离线环境，面向金融、医疗、制造等对数据合规要求较高的行业。
三星推出AI健康助手，进军智能健康市场
7小时前
分享到:

三星推出AI健康助手，进军智能健康市场。该产品将于8月以测试版形式上线。
淘宝天猫开展AI批量套图专项治理
9小时前
分享到:

2026年7月15日起，淘宝天猫平台启动“AI批量套图”专项治理。平台巡检发现，部分商家利用AI技术对同一底图批量生成高度雷同商品图，引发消费者投诉，损害购物体验与平台生态。依据《淘宝网商品发布规范》及《天猫商品发布规范》，平台对违规商品视情节采取搜索推荐降权或屏蔽等处置措施。本次治理覆盖全站商品，旨在保障图片真实性与消费者知情权。
阿里联合上海交大推出免费AI暑期通识课
9小时前
分享到:

2026年7月21日，阿里巴巴联合上海交通大学学生创新中心，在千问App上线“千问AI创想课堂”暑期公益课程，面向全国中小学生免费开放。课程覆盖对话、创作、探索等维度，按年级分设《我的AI新朋友》《我的超级学习搭子》《智能时代创造者》三大递进模块，强调“在做中学”。依托千问AI能力，课程旨在推动AI通识教育下沉至基础教育阶段。后续将通过公益形式拓展至更多校园。
可口可乐创吉尼斯纪录并发布AI范志毅数字人
9小时前
分享到:

2026年7月19日，可口可乐在中国完成“最多人参与的线上TIFO照片拼图”吉尼斯世界纪录认证。作为2026 FIFA世界杯官方合作伙伴，其同期开展“此刻举杯为我们的FIFA世界杯”主题营销。活动期间，品牌推出行业首个超写实明星实时互动数字人——AI范志毅，集成实时互动、多模态对齐及方言级声音克隆技术，实现从赛后传播向赛事实时参与的营销升级。
具识智能发布全球首个具身语义智能体系统
12小时前
分享到:

具识智能正式发布全球首个具身语义智能体系统insightOS Semantic，同步发布具识开发者生态社区与开发者培育计划。目前，insightOS Semantic已在售货仓取货配送、拆码垛搬运、多机协同流水线、定时巡检等多个真实物理世界作业场景完成验证。
月之暗面黄震昕：B端收入中API调用占比达70%，已形成可持续的正向循环
12小时前
分享到:

今日，月之暗面（Moonshot AI）B端企业业务负责人黄震昕透露，公司即将上线Kimi Hosted Agent平台，面向ToB客户开放沙箱与Harness能力，打造标准化的企业级能力输出接口。据介绍，该平台提供PPT生成、投研系统搭建等标准化API，支持客户自定义输出风格，可直接嵌入企业内部办公系统使用。他还表示，当前B端收入中，API调用业务占比达到70%，整体商业化路径清晰，已形成可持续的正向循环。
阿里千问发布 Qwen-Image-3.0
12小时前
分享到:

阿里千问大模型正式推出Qwen-Image-3.0，Qwen-Image 系列的第三代图像生成基础模型。新模型支持最大4.5k token输入，支持10px小字精准渲染，支持12国语言原生渲染。
2026年全球AI模型与平台支出将达642.52亿美元
17小时前
分享到:

据Gartner美国当地时间2026年7月20日发布数据，全球终端用户2026年在AI模型及平台上的支出预计达642.52亿美元，同比增长63.4%。其中生成式AI模型投资增长117%，AI平台支出增长36.9%。支出增长主要来自基础GenAI模型（+104.2%）、DSLM专用模型（+210.0%）及AI应用开发平台（+38.6%）。分析师指出，企业正转向注重成本透明度、使用效率与可衡量结果的AI供应商，基于用量的定价模式推动平台需强化评估、监控与成本管控能力。

【腾讯云】 4核4G服务器新客 38元/年起，支持 OpenClaw/Hermes 等热门镜像；Token Plan 低至28元/月，多种主流模型极速调用