华为云宣布首发适配 DeepSeek-V4,MaaS 平台上线免部署、一键调用 API 的 Tokens 服务,支持 DeepSeek-V4-Flash。官方称已针对长上下文推理、KVCache 管理及昇腾融合算子完成优化,并支持原生 100 万 Token 上下文推理。
华为云宣布首发适配 DeepSeek-V4,MaaS 平台上线免部署、一键调用 API 的 Tokens 服务,支持 DeepSeek-V4-Flash。官方称已针对长上下文推理、KVCache 管理及昇腾融合算子完成优化,并支持原生 100 万 Token 上下文推理。