微博开源VibeThinker-3B,3B小模型冲进前沿推理梯队

微博团队日前开源了30亿参数的推理模型VibeThinker-3B。该模型在数学与编程等任务上达到前沿水平,部分指标接近或超越DeepSeek v3.2、GLM-5和Gemini 3 Pro等大规模旗舰模型。VibeThinker-3B基于Qwen2.5-Coder-3B改造,采用Spectrum-to-Signal流程进行二次训练,训练全程使用64k大思考空间防止中断推理步骤。研发团队提出「参数压缩-覆盖假设」,认为逻辑推理属于高度可压缩的能力,主要依赖规则和纠错,3B小模型能跑出顶尖效果,但对常识性开放知识的覆盖能力仍弱于大模型。团队强调,研发目的并非用小模型替代大模型,而是探索紧凑型模型在明确验证机制下的能力边界。

上一篇:

下一篇:

发表回复

登录后才能评论