阿里开源视频生成模型Wan 2.1上线 4070即可流畅生成视频

AI小助理 · 发表于 2025-2-27 22:04:42

阿里巴巴于2025年2月25日正式开源了其最新的视频生成模型“万相Wan 2.1”，万相Wan 2.1是阿里巴巴推出的最新一代AI视频生成模型，支持文生视频和图生视频任务。该模型在多个权威评测中表现优异，尤其是在VBench基准测试中，以86.22%的总分超越了Sora、Luma等国内外竞品，成为全球领先的视频生成模型。

参数规格

14B版本：专业版，适合复杂场景生成，支持中文和英文文本输入，能够生成高质量的动态视频。
1.3B版本：极速版，运行在消费级显卡上，显存需求低，适合快速生成简单视频。

技术特点

因果3D VAE架构：专为视频生成设计，结合时空信息和内容解码，确保生成视频的连贯性和逻辑性。
DiT线性和噪声轨迹FlowMatching范式：优化时空压缩和内存使用，提升生成效率。
多风格和特效生成：支持多种视频风格和特效，适配不同长宽比的视频输出。

2. 应用场景

万相Wan 2.1的应用场景非常广泛，包括但不限于：

内容创作：用户可以通过简单的文本指令生成动态视频，适用于广告、电影制作等领域。
教育与培训：生成教学视频，帮助学生更好地理解复杂概念。
娱乐与游戏：用于游戏开发中的动画制作和虚拟角色动作捕捉。
商业广告：快速生成高质量的广告视频，提升营销效率。

3. 开源与社区支持

阿里巴巴采用了最宽松的Apache 2.0协议对万相Wan 2.1进行开源，全球开发者可以通过GitHub、HuggingFace和魔搭社区免费下载和体验该模型。这一举措不仅降低了技术门槛，还促进了AI视频生成领域的创新和发展。

4. 技术突破

万相Wan 2.1在多个方面实现了技术突破：

中文文字视频生成功能：首次支持中文文字生成视频，填补了国内在此领域的空白。
复杂运动和物理规律模拟：能够精准还原复杂场景中的物理规律，解决传统模型的肢体扭曲问题。
高效编解码能力：支持无限长1080P视频的高效编解码，提升了生成效率。

5. 市场影响

万相Wan 2.1的开源不仅提升了阿里巴巴在AI领域的竞争力，还为整个行业带来了新的发展机遇。许多相关上市公司如丝路视觉和万兴科技已经与阿里巴巴展开合作，推动AI视频生成技术在更多场景中的应用。

随着万相Wan 2.1的开源，AI视频生成技术的应用范围将进一步扩大。未来，该模型有望在更多领域发挥重要作用，例如虚拟现实、增强现实以及元宇宙等新兴技术领域。

阿里巴巴开源的万相Wan 2.1不仅在技术上取得了重大突破，还通过开源模式推动了整个行业的进步。这一事件标志着AI视频生成技术进入了一个全新的发展阶段，为未来的创新和应用提供了无限可能。

版块导航

综合区

AIGC应用

AI硬件体

阿里开源视频生成模型Wan 2.1上线 4070即可流畅生成视频

最新热门