
来自阿里的消息,阿里巴巴(BABA.US)正式发布世界模型产品HappyOyster(快乐生蚝),基于原生多模态架构,具备多模态理解与音视频联合生成能力。该产品由阿里ATH创新事业部研发,与HappyHorse同团队。
相比大语言模型相对成熟的模型架构和技术范式,世界模型仍属于前沿探索领域。阿里的HappyOyster与谷歌的Genie3同属于世界模拟器流派。区别于传统文生视频模型输入提示词、等待渲染、获得成片的被动流程,这一流派采用长时间跨度上的世界演化建模方式。
HappyOyster实现“漫游”(Wander)与“导演”(Direct)两大核心功能,支持用户实时构建可交互、可保存、可二次创作的AI数字世界。区别于传统文生视频的被动流程,其采用长时序世界演化建模,融合文本、动作、图像等控制信号,主动模拟空间、物理与因果演化,实现生成质量、时序与可控性协同优化。
在漫游模式下,产品支持1分钟连续位移与镜头控制,画面质量高、风格泛化强;导演模式可实现3分钟以上480p/720p实时生成,支持任意节点通过多模态指令改写剧情、调度角色。当前双模式尚未完全融合,但未来将向“边探索边创造”演进。
该模型已在游戏、影视、文旅及教育等领域展现应用潜力,可降低内容生产成本、缩短创意验证周期,并推动从被动观看向沉浸交互跃迁。
🔗本产品官网
本文观点不代表发现AI立场,转载请联系原作者。

