小米发布MiMo-V2.5-TTS/ASR语音大模型：通过自然语言指令调度声音表现

资讯组小编 • 2026年4月24日上午9:19 • 新品

4月24日，继前一日MiMo-V2.5系列大模型公测后，小米技术团队今日再次加码，正式发布MiMo-V2.5-TTS系列与MiMo-V2.5-ASR，补齐语音输入与输出全链路。

其中，TTS系列包含三款模型，均支持通过自然语言指令精细调度声音表现。MiMo-V2.5-TTS：内置多款精品音色，开箱即用，支持语速、情绪控制。MiMo-V2.5-TTS-VoiceDesign：支持一句话从零生成全新音色，无需参考音频。MiMo-V2.5-TTS-VoiceClone：数秒参考音频即可高保真复刻目标音色，并保留原有风格指令控制能力。官方演示显示，模型能遵循“尖锐刻薄、狐假虎威”等复杂指令，并支持在文本中插入音频标签进行精细化控制。

作为听觉基座，MiMo-V2.5-ASR今日正式开源（包括模型权重与代码）。该模型面向复杂真实场景，支持吴语、粤语等中文方言，以及中英文混说、强噪音、多人对话等场景，并原生输出标点符号，转写结果即拿即用。

目前，TTS系列已在MiMo Studio开放快速体验，ASR代码与权重可在GitHub和HuggingFace获取。小米预告，下一步将向通用音频生成（音效、音乐）及更强的上下文理解能力扩展。

本文系【发现AI】原创内容，部分内容综合自网络，如有侵权，请联系编辑删除。
转载请注明来源：https://www.faxai.cn 发现AI

MiMo-V2.5-TTS/ASR

赞 (0)

资讯组小编

微信扫一扫

微信扫一扫

GPT-5.5发布！更强更快更贵，内测英伟达工程师：失去它像被截肢

GPT-5.5发布！更强更快更贵，内测英伟达工程师：失去它像被截肢

上一篇 2026年4月24日上午8:54

AI转型，老板们没说破的四个底层逻辑

下一篇 2026年4月24日上午9:53

扫码关注我们，了解最新AI资讯~

新品

小米深夜突袭！发布 AI 编程助手 MiMo Code ，语音操控+记忆系统成最大杀器

资讯组小编
2026年6月11日
新品

虾马之后又火一个！OpenHuman用20分钟了解你的一切，存成卡帕西式知识库

资讯组小编
2026年5月16日
新品

抢疯了！AI宠物翻译器：800多块，预售2万单

资讯组小编
2026年5月25日
新品

Kimi Work Beta 版邀你体验：你的工作，分我一半

资讯组小编
2026年6月3日
新品

华为云发布自研龙虾办公智能体OfficeClaw，今日起每天上午10 点限量发放邀请码

资讯组小编
2026年4月17日
新品

独家｜高德内测Vibe Coding产品“袋马”，入局AI零门槛应用生成赛道

资讯组小编
2026年6月29日

发表回复

登录后才能评论

红果短剧发布AI剧角色创作规范
8小时前
分享到:

2026年7月22日，红果短剧发布《关于规范AI剧角色创作的公告》，明确角色差异化与版权合规双标准。公告要求主要角色须具高辨识度，杜绝‘高频AI脸’复用；严禁未经授权使用他人独创角色、造型及美术作品。平台将于近期开展专项治理，整治AI脸复用、内容同质化及素材违规问题，并已提升都市情感等品类AI仿真人剧准入门槛，强化画面衔接、表情变化等质量审核。
马斯克：AI发展不可逆，不应按下停止按钮
8小时前
分享到:

2026年7月，埃隆·马斯克在接受《经济学人》采访时指出，人工智能与机器人发展势头不可逆转，即便存在10%–20%的灾难性失控风险，人类也不应阻止其进步。他预测AI将在约五年内超越人类整体智慧，有望带来全民富足时代。马斯克强调，人类难以长期掌控超级智能，关键在于赋予AI正确价值观。他建议全球头部AI公司负责人定期召开安全协调会议，以实现相互监督与制衡。
特斯拉Grok AI助手将于2026年夏覆盖全欧洲
12小时前
分享到:

2026年7月，特斯拉宣布其集成SpaceXAI技术的Grok人工智能助手将于2026年夏季软件更新（版本2026.26）起正式覆盖整个欧洲市场。此次更新新增车辆硬件语音控制功能，支持拨打电话、播放音乐、调节空调、开启手套箱等操作。Grok自2025年夏率先在美国上线，后陆续拓展至加拿大、澳大利亚及部分欧亚国家。本次升级还同步面向印度、马来西亚等新增亚洲市场。该功能通过“Hey Grok”唤醒，依托自然语言处理技术实现交互，未来将与FSD深度融合，支持靠边停车、自动变道等指令。
混元多模态理解负责人胡瀚离职创业，原团队或将聚焦世界模型
12小时前
分享到:

近期，腾讯混元多模态理解负责人胡瀚提出了离职。2025年初加入腾讯后，负责视觉大模型的研究。在后续的调整中，他加入大语言模型部旗下的“Frontier”前沿技术研究组，负责多模态理解的相关研究，汇报给姚顺雨。据了解，胡瀚还曾承担世界模型的研发工作。腾讯大语言模型部负责人姚顺雨近期正在密集梳理旗下团队，胡瀚此前所在的研究组或将聚焦世界模型的前沿研究。
北京：鼓励发展Token（词元）经济，加大算力券等支持力度
12小时前
分享到:

北京市发展改革委等部门联合印发《北京市关于加快智能体引领发展的若干措施》，推动智能体创新引领发展，率先培育智能经济新形态。鼓励发展Token(词元)经济。推动创新主体研发适配智能体系统调用、复杂任务调度与高频决策的通用处理器，开发低延迟、高吞吐专用推理芯片。推动创新主体开展推理架构等关键技术攻关，通过异构协同、存算协同以及智能调度等降低推理成本，加快推理缓存复用、智能任务路由等应用层效率优化，全链路优化提高Token效率。重构产品形态和服务模式，培育Token即服务（TaaS）、智能体即服务（AaaS）、结果即服务（RaaS）等商业新模式，推动更多符合条件的Token新产品新服务纳入中小企业服务券配券产品范围。加大算力券等支持力度，鼓励有条件的区联合创新主体探索发放Token券、智能体服务券等加速智能体等推广应用。
白宫高级官员指责中国公司月之暗面复制Anthropic的模型，外交部：中方一贯反对将科技经贸问题政治化、工具化，这不符合任何一方的利益
16小时前
分享到:

7月23日，外交部发言人林剑主持例行记者会。有记者提问，白宫高级官员周三指责中国公司月之暗面复制了Anthropic的模型，外交部对此有何评论？林剑表示，中国人工智能的发展既是推动高水平科技自立自强的成果，也得益于中国始终秉持共商、共建、共享理念。各国应当秉持以人为本、向上向善的理念，推动人工智能开放、包容、普惠、向善发展，更好地服务人类文明进步和国际社会的共同福祉。他强调，中方一贯反对将科技经贸问题政治化、工具化，这种行径只会干扰全球人工智能的发展进程，不符合任何一方的利益。
阿里国际站：Accio Work用户数量超千万，一年内增长逾30倍
16小时前
分享到:

7月23日，在杭州一场全球跨境电商峰会现场，阿里国际站总裁张阔透露，全球已有1000万中小企业在用Accio Work做生意，一年内增长逾30倍。据悉，过去12个月中，阿里国际站上的中小企业Token消耗量翻了10倍。与此同时，Accio Work单次任务的使用成本下降了50%。
飞书Agent产品飞书aily升级，支持自主工作、团队共享智能体
16小时前
分享到:

7月23日，飞书内的Agent产品飞书aily全新升级。新版飞书 aily 能够在用户授权范围内，基于飞书消息、文档、日历、会议、任务和多维表格等信息开展工作，主动跟进任务，并与团队成员或其他智能体分工协作。
DeepSeek今年已增资65%
16小时前
分享到:

据媒体报道，近日，DeepSeek创始人梁文锋一场4小时的投资人闭门会议实录在科技与创投圈刷屏，他明确表示“DeepSeek只有一条主线，即通往通用人工智能（AGI）”，相关话题引发关注。天眼查App显示，DeepSeek关联公司杭州深度求索成立于2023年7月，法定代表人为裴湉，经营范围含工程和技术研究和试验发展、软件开发、人工智能应用软件开发等，由梁文锋、宁波程恩企业管理咨询合伙企业等共同持股。变更记录显示，该公司今年发生两次增资，注册资本由1000万人民币增至约1645万人民币。
黄仁勋：市场低估了中国模型Kimi的影响力，就像此前低估了DeepSeek2
18小时前
分享到:

近日，英伟达创始人、CEO黄仁勋在接受节目采访时，被问及美国该如何应对来自中国AI产业的竞争，黄仁勋表示，“中国模型非常出色”，市场低估了开源模型Kimi带来的影响力，就像此前低估了DeepSeek一样。

【腾讯云】 4核4G服务器新客 38元/年起，支持 OpenClaw/Hermes 等热门镜像；Token Plan 低至28元/月，多种主流模型极速调用