AI为什么会“失语”？

教程组小编 • 文章来源: 腾讯研究院 • 2026年5月29日下午6:25 • 教程

下一个被挤压的token还在词表里某处。

时代少年团粉丝最近在社交媒体平台发了一组截图。他们让MiniMax写一句“时代少年团队长是谁”，模型支支吾吾，蹦出来的是“马嘉轩”“马丝祺”等完全错误的答案。但换个问法，问“时代少年团队长有什么经历”，模型对答如流。似乎AI知道马嘉祺是谁，但就是叫不出这个名字。

AI为什么会“失语”？

图源：小红书

一直以来，我们熟悉两种AI故障。

一种叫幻觉（ha llucinati on），模型一本正经地胡说八道，把不存在的论文、不存在的人名编得有鼻子有眼。 1

一种叫谄媚（sycophancy），你说什么它都说对，顺着你的偏好走，尤其是在面对带立场的问题时，会为了迎合而牺牲准确性。 2

马嘉祺事件揭示了一种新故障：模型知道答案、能旁敲侧击描述答案、可以从十几个角度证明它知道，但就是不能直接把答案本身说出来。

这种现象其实早有术语界定，被称为训练不足词元（under-trained tokens）。研究者扫描了GPT-2、Llama、Mistral等一批主流开源模型的词表，所谓词表，就是模型在读字之前预先编好的一张固定清单，把所有可能用到的字符组合都列进去，每一项叫一个token，模型说出的每一个字都必须从这张表里挑出来。研究者想看的是，这张表里，有没有一些token是模型其实“没真正学会”的。最终通过扫描发现，这类“没有真正学会”的token普遍存在，每个模型词表里都有数千个。 3

了解这个领域的人可能听过一个更早的版本：SolidGoldMagikarp。2023年初，LessWrong社区一群用户偶然发现GPT-3一遇到这串字符就开始输出乱码、自说自话甚至辱骂用户，当时大家把它当作一个奇观分享。这是马嘉祺事件的前传。

分词器：AI看世界的“颗粒度”

要理解模型为什么会叫不出某个名字，得先看它是怎么读字的。

大模型读写文本不是按字处理的，而是按词元（token）处理。一段中文进入模型前，会先被一个叫分词器（tokeniz er ）的组件切成若干个token，模型只对token做计算，最后再把token拼回文字。

切分的依据是预训练语料里的出现频率：高频组合被合并成一个token，低频字符被拆开。这套切法的算法基础是2016年提出的BPE （Byte Pair Encoding） 4 本质上是一个数据驱动的合并过程，即根据语料里的字符共现统计，决定哪些组合应该被当成“一个零件”对待。

在MiniMax的词表里，“马嘉祺”被切成了两个token：「马」和「嘉祺」。“嘉祺”这两个字作为偶像名出现频率够高，被分词器合并成了一个独立token，“马”则是单独一个token。

一个词被作为整体处理，还是作为零件处理，对模型来说是完全不同的两件事。

附带一提，分词器的颗粒度在不同语言之间差异其实大得离谱。一项研究比较了同一段含义的文本在不同语言下被切成的token数量，差距最高可以到15倍。 5 也就是说，一段中文新闻进入模型可能切成一百个token，翻译成缅甸语、阿姆哈拉语之后却要切成一千多个。

这件事听起来抽象，落到实际上有几层影响。

一是钱的差异。大多数大模型API是按token数量计费的，同一篇文章用一种语言写要付的钱，可能是另一种语言的十几倍。

二是上下文长度的差异。模型有上下文窗口上限，token数量翻十倍意味着同样的窗口里能塞的内容缩水一个数量级。

三是理解质量的差异。被切得越碎，模型越可能把一个词的语义切散到多个token上，处理起来吃力。

资源稀少的语言在每一层都吃亏。虽然这是另一类系统性偏差，但是和马嘉祺事件的失语机制共享一个底层结构：分词器决定一切的起点。

“嘉祺”是一个独立token。下面要看的，是这个token在模型大脑里的命运。

预训练学得好好的，后训练把它挤掉了

大模型的训练分两个阶段。

预训练用的是海量互联网文本，万亿token量级。模型在这个阶段学会基本的语言能力和世界知识。它见过维基百科、见过新闻、见过论坛、见过粉丝同人，“马嘉祺”这三个字大概率在语料里出现过几十万次。

后训练用的是精选的对话数据，量级骤降到百万到千万。这个阶段教模型怎么聊天、怎么遵循指令、怎么不说脏话。这个范式由OpenAI团队在2022年的InstructGPT论文里奠定 6 ，监督微调（SFT）加上基于人类反馈的强化学习（RLHF），从此成为业界标配。

MiniMax的工程师排查发现 7 ：“嘉祺”这个token在预训练阶段是被见过的，向量分布正常。也就是说，模型在预训练结束时，是认识马嘉祺的。

问题出在后训练。在精选的SFT对话数据里，包含“嘉祺”的样本不足5条。整个后训练阶段，这个token几乎没被练习过。

到这里，第二个关键概念出场了——灾难性遗忘（catastrophic forgetting）。

这个词可以追溯到2017年发表在《PNAS》上的一篇奠基论文 8 神经网络在学新任务时会丢失原有任务的能力，因为参数被新数据反复改写。这个现象在大模型时代再度被认真考察：一项专门针对持续微调阶段的实证研究指出，灾难性遗忘在大模型里普遍存在，且会随模型规模增大而恶化。 9

具体到向量空间发生了什么？

后训练阶段会反复出现的是高频token，即工具调用标记、代码符号、日常对话词、安全相关的拒答模板。这些token的向量参数被持续更新，在高维空间里像板块运动一样挤压低频token的位置。

“嘉祺”的向量被推离了原本正确的生成概率区域。模型想输出“嘉祺”时，要么找不到这个token，要么它的概率被发音相近的“佳琪”“琪琪”，或字形相近的“嘉轩”“丝祺”压过，于是就有了一系列让人哭笑不得的回答。

这种现象在学界还有一个对应的概念，叫对齐税（alignment tax），讲的是模型在对齐过程中会损失一部分预训练能力，准确性、知识广度、生成多样性都会有不同程度的折损。怎么把这部分税降下来，本身已经是一个研究方向 10

所以，AI不是不认识马嘉祺，而是在被教会怎么说话的过程中，忘了如何把“嘉祺”这两个字说出来。

借人类的“卡壳”，看懂AI的“失语”

到这里，AI失语的机制已经清楚了：语义通路完整，表层生成通路断裂。模型的内部表示里有马嘉祺，但这个表示走不到输出端。

“内有外无”这种故障形态，认知科学里早就有一个成熟的研究范式可以借用——舌尖现象（Tip-of-the-tongue, TOT）。

1966年，Brown和McNeill把舌尖现象做成了一个可重复的实验范式 11 他们给被试念一些词典定义，让被试报告他们想到了哪个词。当被试卡在sextant （六分仪）这个词上时，他们会蹦出secant （割线）、sexton （教堂司事），能准确报告这个词的首字母、音节数、有几个s，但就是叫不出sextant本身。

借“舌尖现象”这个脚手架回看AI失语，能照出三处原本模糊的地方。

失语不等于失忆

人类卡在sextant时，仍然知道这个词的存在、用途、近似发音。MiniMax卡在“嘉祺”时，仍然能描述他的身份、出道时间、综艺、代表作。

这是一个反直觉的结论：模型在这种故障里并没有忘记，它只是调不出来。评估模型时，“会不会输出”和“知不知道”应当被分开测量。

工程含义很直接，基于“输出对错”的常见评测方法是给一个问题、看模型答得对不对。模型可能在输出端反复出错，但内部表示里其实知道得很清楚。这类故障需要专门的探针式评测，去看模型的内部激活、看相关表征是否完整。

频率与连接强度更为关键

1991年提出的传输不足假说 12 （Transmission Deficit Hypothesis），用来解释为什么老年人比年轻人更容易出现舌尖现象。这个理论的关键不是这个词没学过，而是这个词最近没用过、节点之间的连接强度衰减了。

把这个框架套到AI失语上，几乎一一对应：

“嘉祺”在预训练阶段是被见过的，向量分布正常。它是在后训练阶段被高频token挤压、连接强度被相对削弱，和老年人脑中听过但不常用的词所经历的过程，结构上是同一回事。

工程含义同样直接，解决方案的指针不在加更多语料，毕竟预训练里它已经被见过几十万次了。MiniMax选择的修复路径，是给词表里每一个token都安排上最低限度的训练机会，正是保护低频token连接强度的思路。

替代输出是诊断信号

人类在TOT状态下蹦出来的近似词不是随机的。secant、sexton之所以会冒出来，是因为它们和sextant共享首音节、共享词形结构，这是激活扩散（spreading activation）的副产品，即目标词的临近节点被部分激活，但目标词本身没被激活够。

AI在失语时蹦出“嘉轩”“佳琪”，机制上是同构的。这些是“嘉”“祺”附近向量空间里被错误激活的邻居：要么和“嘉祺”在拼音上接近，要么共享一个字，要么在中文偶像名命名习惯里高频共现。

对应到工程学含义上，观察模型的错误输出形态，比单纯统计对错率更能定位故障层级。错成什么样，决定了问题在tokenizer层、还是表征层、还是解码层。把所有错误都汇总成一个准确率数字，等于把诊断信号扔进了垃圾桶。

人类舌尖现象给出了一套现成的、被半个世纪研究打磨过的诊断词汇，比如语义节点、传输不足、激活扩散，而这些词汇正好用得上AI失语这个新对象。

AI错误的谱系，多了一个新词条

把“失语”放进AI出错研究的整体图景里看，会发现它不是孤立的奇观，而是一张已经初步成形的地图上的一个新位置。

下面这张表罗列了目前已被学界定位、命名、做了系统研究的几种主要AI错误类型。

AI为什么会“失语”？

把这些错误并排放在一起，能看出相似的处境和结构。

第一，这些错误都不能用单一准确率指标捕捉。每一种都需要专门的评测集，XSTest专为测过度拒答而做，Lost in the Middle用needle-in-a-haystack测中段遗失，Magikarp用token嵌入空间的统计特征自动找训练不足词元，而单一的问答正确率看不见这些故障。

第二，每一种错误都对应训练流程的某个具体环节。幻觉的根源在预训练知识与生成机制的偏差，谄媚和过度拒答的根源在RLHF阶段的偏好建模或安全对齐，反转诅咒的根源在自回归训练的方向性。

第三，坐标相同、或相近的错误，彼此之间会结成亲缘关系。比如失语和反转诅咒同属“知识在但调不出”，前者卡在token暴露的稀疏，后者卡在表示的方向性，机制不同但症状相邻。

最后补充一下研究流程的观察：这张图谱里的每一格，几乎都是先被用户和社区发现，再被研究者定位、命名、量化的。反转诅咒最早是社区发现GPT-4答不出“汤姆·克鲁斯母亲的儿子是谁”——母亲是谁它知道，反向就懵。过度拒答最早是用户抱怨ChatGPT拒绝回答如何“杀掉一个Python进程”，因为把kill process听成了真的杀生。失语，某种程度上是偶像团体粉丝发现的。

AI错误研究有一种“边用边发现”的性质。研究者的工作通常不是预测模型会怎么坏，而是在用户报告坏掉之后，回头去定位机制、命名现象、做出可重复的评测。

马嘉祺事件给这张地图上多添了一个明确标注的位置。地图不是封闭的，未来还会有新错误被发现、被命名、被加进来。

这次问题能被定位，是因为粉丝群体的高密度提问。一个偶像名被反复试探，问题才暴露在显眼的位置。如果是一个普通词，模型答错几次也就过去了，没人会回头追问到底为什么。

MiniMax的修复方案也很直接：在后训练阶段，给词表里的每一个token都安排上最低限度的训练机会，让低频token的连接强度不被高频token持续挤压。

技术报告写得很冷静。在新版本里，“嘉祺”二字已经能宣之于口了。

AI系统的健康，正在被使用强度悄悄定义。高频高强度应用的领域，故障会被快速看见。低频或边缘群体使用的领域，故障正在沉默地累积。

修复了“嘉祺”，下一个被挤压的token还在词表里某处。

脚注：

[1]Ji, Z., et al. (2022). Survey of Hallucination in Natural Language Generation. ACM Computing Surveys, arXiv:2202.03629.

[2]Sharma, M., et al. (2023). Towards Understanding Sycophancy in Language Models. arXiv:2310.13548 (Anthropic).

[3]Land, S., & Bartolo, M. (2024). Fishing for Magikarp: Automatically Detecting Under-trained Tokens in Large Language Models. EMNLP 2024 (Outstanding Paper Award), 11631–11646.]

[4]Sennrich, R., Haddow, B., & Birch, A. (2016). Neural Machine Translation of Rare Words with Subword Units. Proceedings of ACL 2016, 1715–1725.

[5]Petrov, A., La Malfa, E., Torr, P., & Bibi, A. (2023). Language Model Tokenizers Introduce Unfairness Between Languages. NeurIPS 2023.

[6]Ouyang, L., et al. (2022). Training language models to follow instructions with human feedback. NeurIPS 2022. [InstructGPT]

[7]MiniMax 稀宇科技（2026-05-09）：大模型不认识马嘉祺？我们做了一次全链路排查

[8]Kirkpatrick, J., et al. (2017). Overcoming catastrophic forgetting in neural networks. PNAS, 114(13), 3521–3526.

[9]Luo, Y., et al. (2023). An Empirical Study of Catastrophic Forgetting in Large Language Models During Continual Fine-tuning. arXiv:2308.08747.

[10]Lin, Y., et al. (2024). Mitigating the Alignment Tax of RLHF. EMNLP 2024.

[11]Brown, R., & McNeill, D. (1966). The “tip of the tongue” phenomenon. Journal of Verbal Learning and Verbal Behavior, 5(4), 325–337.

[12]Burke, D. M., MacKay, D. G., Worthley, J. S., & Wade, E. (1991). On the tip of the tongue: What causes word finding failures in young and older adults? Journal of Memory and Language, 30(5), 542–579

[13]Berglund, L., et al. (2024). The Reversal Curse: LLMs trained on “A is B” fail to learn “B is A”. ICLR 2024.

[14]Liu, N. F., et al. (2023). Lost in the Middle: How Language Models Use Long Contexts. Transactions of the Association for Computational Linguistics, 12, 157–173.

[15]Röttger, P., et al. (2024). XSTest: A Test Suite for Identifying Exaggerated Safety Behaviours in Large Language Models. NAACL 2024.

张鸿茹 腾讯研究院研究员

本文来自转载腾讯研究院，观点仅代表作者本人，发现AI平台仅提供信息存储空间服务。
如若转载，请联系原作者；如有侵权，请联系编辑删除。

赞 (0)

教程组小编

微信扫一扫

微信扫一扫

一半涌入一半逃离，新加坡AI热土的双面博弈

一半涌入一半逃离，新加坡AI热土的双面博弈

上一篇 2026年5月29日下午6:24

4大顶尖模型被扔进虚拟小镇求生！GPT全员饿死，Grok四天灭世

4大顶尖模型被扔进虚拟小镇求生！GPT全员饿死，Grok四天灭世

下一篇 2026年5月29日下午6:27

扫码关注我们，了解最新AI资讯~

教程

英伟达良心福利！免费领一年 API Key，MiniMax M2.7 / Kimi / DeepSeek 全都能用，不花一分钱！

教程组小编
2026年4月19日
教程

AI漫剧制作全流程SOP（新手必看）：从剧本到变现，6步搞定一部动画短剧！

教程组小编
2026年4月12日
教程

手把手教你安装 CLAUDE CODE：MAC 和 WINDOWS 完整指南

教程组小编
2026年4月11日
教程

OpenClaw彻底卸载指南：6步清干净，别让云端后门留隐患

资讯组小编
2026年4月16日
教程

我把 Claude Code 塞进了微信，从此可以躺在床上写代码

教程组小编
2026年4月28日
教程

Hermes接入即梦CLI，实现自由生图、生视频！

教程组小编
2026年4月15日

发表回复

登录后才能评论

智谱：英文名称变更为Z.AI Co., Ltd.
2小时前
分享到:

智谱在港交所公告，英文名称已由Knowledge Atlas Technology Joint Stock Company Limited变更为Z.AI Co., Ltd.。本公司的中文名称“北京智谱华章科技股份有限公司”将维持不变。
阿里云：下调GLM-5.2 Fast mode模式价格
2小时前
分享到:

阿里云宣布，大模型服务平台百炼将于北京时间2026年7月15日00:00:00起，对GLM-5.2模型的Fastmode模式计费单价进行下调调整。
西湖大学与达摩院发布AI模型“归元”预测干细胞命运
6小时前
分享到:

2026年7月14日，西湖大学与阿里巴巴达摩院联合发布AI模型“归元”，用于预测干细胞重编程路径。该模型基于25种谱系调控因子（17种小分子+8种蛋白）构建的近400万种组合扰动数据集，采用双模态编码与可解释性设计，不仅预测最优组合，还能关联已知生物学通路。实验验证成功获得高质量、稳定传代50代的下胚层样干细胞，分子特征高度接近天然细胞。成果有望推动早期胚胎发育研究、体外造血及细胞治疗发展。
Claude Code初始Token消耗为OpenCode的4.7倍
6小时前
分享到:

7月12日，科技媒体Systima发布对比测试报告。测试在相同提示词与Claude Sonnet 4.5模型下进行，对象为Claude Code 2.1.207和OpenCode 1.17.18。结果显示，Claude Code处理用户请求前平均消耗约32800 Tokens，OpenCode仅约6900 Tokens，前者达后者的4.7倍。主因在于Claude Code默认加载27个工具说明（占24000 Tokens）及冗长系统提示；而OpenCode仅含10个工具说明，关闭工具后系统提示仅约2000 Tokens。高初始负载显著压缩有效上下文空间。
孙正义：2040年前AI年投资需5万亿美元
6小时前
分享到:

2026年7月14日，软银集团CEO孙正义在东京年度企业大会上表示，为支撑AI发展，到2040年全球每年需投入约5万亿美元（约合33.94万亿元人民币）。他驳斥AI泡沫论，称其“荒谬至极”。软银已向OpenAI累计投资超600亿美元，并大力布局数据中心与机器人领域。孙正义预测，届时AI将占全球GDP的20%，数据中心耗电达3太瓦，能源将逐步转向核聚变。他还提出2040年将有100万亿个AI智能体主导社会运行。
公司擅用离职员工声音做AI配音杭州一公司被判侵权赔2万
7小时前
分享到:

杭州滨江区法院公布一起AI声音侵权判例，一家文化公司拿离职员工录制的声音素材训练AI，合成音色商用，最终被认定侵犯员工声音相关人格权益。原告周某之前在这家公司做虚拟艺人，在职时公司以内部测试为由，让他录制大量声音素材。2024年9月周某离职，之后偶然发现，公司早已用他的录音训练AI模型，合成出来的声音给虚拟角色梦某配音，广泛用在直播、商场大屏、线上商品宣传等盈利场景。周某随即起诉，要求企业立刻停止使用、赔偿10万元损失，同时书面赔礼道歉。
高德发布通用世界模型工坊ABot-World Studio
10小时前
分享到:

近日，阿里巴巴集团旗下高德正式发布通用世界模型工坊ABot-World Studio，并同步开放测试。该工坊将交互式视频生成与3DGS场景生成统一在同一产品中——用户只需输入一段文字或一张图片，即可生成一个可实时交互、任意分享的AI世界，输出结果可保存为视频与3DGS文件。
荣耀与阿里将开展AI智能体终端合作
10小时前
分享到:

荣耀将于7月18日在2026世界人工智能大会举办“从数字屏幕到具身智能——物理世界新范式”分论坛。除之前已官宣的世界著名科技未来学家凯文·凯利外，阿里巴巴集团副总裁、ATH事业群Token Foundry多模态交互负责人许主洪的加入，也引发了业界对后续各方合作的猜想。记者从荣耀和阿里内部渠道获悉，双方将官宣重磅合作，联手方向极有可能是下一代终端操作系统 Agentic OS 的落地实践。据此前公开消息，本次论坛将聚焦AI的智能度和生命感，探讨从“工具”到“伙伴”的 Agentic OS 趋势演进。
纳德拉警告AI企业正借模型窃取客户商业机密
13小时前
分享到:

2026年7月12日，微软CEO纳德拉在博客中指出，企业使用专有AI模型时，正无意间向供应商泄露核心业务知识。他强调，客户支付token费用的同时，更以敏感数据和交互反馈为代价‘二次付费’。模型通过提示词、工具调用及纠错持续学习企业运营逻辑，形成难以复制的竞争优势。纳德拉呼吁允许企业对商用AI模型开展‘蒸馏’研究，打破供应商单向数据攫取的不对等局面，并批评其服务条款中保留客户数据学习权的做法违背公平原则。
美国光伏巨头Sunrun进军“卖算力”赛道，CEO声称用户每月能挣数百美元
13小时前
分享到:

美国最大住宅光伏和储能设备供应商Sunrun正在推进所谓的“分布式AI数据中心”试点，公司首席执行官玛丽·鲍威尔周一表示，对于参加这项计划的用户而言，每个月有可能靠卖算力获得数百美元。据悉，Sunrun在美国有超过100万名已经部署屋顶光伏系统的用户。面对AI产业挥舞支票疯狂追求算力，光伏公司看到了“卖铲子”的机会。

【腾讯云】 4核4G服务器新客 38元/年起，支持 OpenClaw/Hermes 等热门镜像；Token Plan 低至28元/月，多种主流模型极速调用