xAI发布Grok Imagine Video 1.5:支持音画同频生成,速度翻倍

xAI正式发布图像与文本生成视频模型Grok Imagine Video 1.5,并在API(grok-imagine-video-1.5)、网页端(grok.com/imagine)及移动客户端全量上线。该模型实现音视频一体化同步生成,在单次推理阶段同步产生音效、环境音与角色对话,提高语音清晰度并优化唇形同步。同时,模型改进了物理引擎与运动一致性,提升镜头长周期内物体运动与物理重量的可信度,减少画面扭曲等伪影。在生成速度上,轻量版Video 1.5 Fast生成6秒720p视频的耗时缩短至约25秒。网页端配套工作流同步更新,新增项目管理以分类整理素材,支持多智能体并行运行多个提示词,并提供媒体库语义搜索。数字艺术家David Thompson团队使用Grok Imagine 1.5制作了完全由AI生成的科幻预告片《Odyssey》。

上一篇:

下一篇:

发表回复

登录后才能评论