刚刚,xAI 悄悄放出 Grok 4.3!马斯克终于开始卷性价比了

在一个无人注意的角落,Grok 4.3,来了。

4 月 17 日,Grok 4.3 Beta 版率先在 Grok 上线,但只对 SuperGrok Heavy 付费会员开放。300 美元/月。

刚刚,xAI 悄悄放出 Grok 4.3!马斯克终于开始卷性价比了

昨天,Grok 4.3 API 正式开放。输入 1.25 美元,输出 2.50 美元,每百万 token。

比上一代 Grok 4.20 便宜了六成。

 


Artificial Analysis 刚更新了评测结果。Grok 4.3 拿到 53 综合分,Intelligence Index 排行榜第 10 名。

比上一代 Grok 4.20 高了 4 分。

刚刚,xAI 悄悄放出 Grok 4.3!马斯克终于开始卷性价比了

这次涨幅最大的单项,是 GDPval-AA。

GDPval 是 Artificial Analysis 新引入的「真实工作」评测,给模型派经济活动里的实际任务,比如营销文案、财务模型、做 PPT。最终由人类评审打分。

Grok 4.20,1179 分。Grok 4.3,1500 分。

一代,上涨 321 分。按 Elo 公式计算,Grok 4.3 对上一代的胜率超过 87%。

它直接超过了谷歌 Gemini 3.1 Pro Preview 和 Meta Muse Spark

但比起 GPT-5.5 和 Claude Opus 4.7,还差得远。并且在它前面,还有三大国产模型:小米 MiMo-V2.5-Pro、DeepSeek DeepSeek-V4-Pro 和智谱 GLM-5.1

刚刚,xAI 悄悄放出 Grok 4.3!马斯克终于开始卷性价比了

一年过去,马斯克的 xAI 似乎离第一梯队越来越远了。

 


在某些项目上,Grok 4.3 也是可圈可点。

IFBench(指令跟随),81%,全榜第一。

τ²-Bench Telecom(客服 Agent 任务),98%,并列第一。

刚刚,xAI 悄悄放出 Grok 4.3!马斯克终于开始卷性价比了

尤其是 IFBench,xAI 从 Grok 4.20 就开始领跑了。

可能这也是为什么 Grok 模型最容易「越狱」「破限」的原因之一吧。指令跟随能力太强,反过来也意味着对恶意指令的服从度更高。

Terminal-Bench Hard 只有 38%。这个基准测的是写终端命令、读日志、调试这些任务,Grok 4.3 明显掉队。

CritPt(物理推理)8%。Humanity’s Last Exam 35%。

推理这块,Grok 4.3 处于中游水平。

 


价格可能才是这次更新的重头戏。

输入 1.25 美元,输出 2.50 美元,缓存 0.20 美元。

刚刚,xAI 悄悄放出 Grok 4.3!马斯克终于开始卷性价比了

这个价格相比御三家,算是很有性价比。

Claude Opus 4.7:输入 5 美元,输出 25 美元。GPT-5.5:输入 5 美元,输出 30 美元。Gemini 3.1 Pro Preview:输入 2 美元,输出 12 美元。

再来一个更直观的对比。跑完 Artificial Analysis 整套测评的总成本,Grok 4.3:395 美元。Claude Opus 4.7(max):4811 美元。

相差 12 倍。

Artificial Analysis 这样形容。

「Grok 4.3 sits comfortably on the Pareto frontier for intelligence versus cost.」

帕累托前沿指那条「再便宜就会变笨,再聪明就得加钱」的边界线。Grok 4.3 在这条线上站稳了脚跟。

 


Grok 4.3 只是一道开胃菜。

马斯克 4 月 18 日曾发文为 Grok 4.4/4.5 预热。

「Grok 4.4 will be twice the size (1T) with training data through early April. Probably ready for release in early May.」

「Grok 4.5 will be 1.5T and hopefully out by late May.」

Grok 4.4,1 万亿参数,5 月初发布。Grok 4.5,1.5 万亿参数,5 月底。

刚刚,xAI 悄悄放出 Grok 4.3!马斯克终于开始卷性价比了

Grok 4.3 现在空降,更像一个工程优化版本。参数约 5000 亿,规模没太大变化,靠训练数据和推理效率把价格降下来,跑分提上去。

卷性价比的 xAI,越来越像 DeepSeek 了。

本文来自转载AI信息Gap ,不代表发现AI立场,如若转载,请联系原作者;如有侵权,请联系编辑删除。

(0)
资讯组小编的头像资讯组小编
一百万个「AI员工」,拿到了第一张身份证
上一篇 8小时前
GPT-image-2 |logo创意
下一篇 8小时前

扫码关注我们,了解最新AI资讯~

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注