![]() 2025年2月17日,字节跳动宣布推出其最新的视频生成模型——FlashVideo。这一创新框架旨在解决当前视频生成领域面临的高计算成本、细节与运动一致性以及实时性差等问题,为用户带来高效、高质量的视频生成体验。 核心特点 高效生成: FlashVideo通过两阶段方法显著提高了视频生成的效率。首先,预览阶段允许用户以极低的成本快速预览视频,减少等待时间,提升商业应用的可行性。其次,在质量增强阶段,FlashVideo能够将270P的低分辨率视频提升至1080P的高清画质,确保最终输出的视频质量。 技术突破: FlashVideo首次成功将RetNet架构应用于视频生成,显著降低了推理时间复杂度。具体而言,基于RetNet的架构将序列长度为L的推理时间复杂度从O(L^2)降低到O(L),大幅提升了推理速度。 高分辨率生成: FlashVideo能够生成1080p的高分辨率视频,仅需102秒,这在同类模型中表现出色。此外,该模型还解决了传统单阶段扩散模型在高分辨率视频生成中的计算成本问题。 细节与运动一致性: 在保持内容与运动一致性的前提下,FlashVideo能够生成丰富的视觉细节,确保生成的视频既流畅又逼真。 |