摩尔线程完成中国移动九天35B大模型全流程适配

4月28日,摩尔线程宣布已基于MTT S5000 GPU完成中国移动自研九天35B通用大模型的全流程适配与推理验证。该适配依托MUSA软件栈及SGLang-MUSA推理引擎,深度优化注意力机制与长序列处理能力。MTT S5000采用第四代‘平湖’架构,单卡AI算力达1000 TFLOPS,支持FP8–FP64全精度计算,显存带宽1.6TB/s,可稳定支撑高并发推理需求。适配成果将于第九届数字中国建设峰会正式发布。

上一篇:

下一篇:

发表回复

登录后才能评论