字节跳动近日发布了名为Seaweed-7B的高性能视频生成模型,该模型以其低成本、高效率和卓越性能吸引了广泛关注。Seaweed-7B是字节跳动Seed团队研发的一款中型研究模型,拥有约70亿参数(7B),通过仅665,000个H100 GPU小时的训练,即可生成高质量视频内容。
![]() Seaweed-7B的核心优势在于其高效的训练策略和强大的泛化能力。尽管使用的是中等规模的计算资源,但其性能可媲美甚至超越更大规模模型,如Wan 2.1和HunYuanVideo。此外,该模型支持多种功能,包括图像生成、视频控制增强、首尾帧调节以及多模态人偶生成等,能够满足不同场景下的创作需求。 在具体应用方面,Seaweed-7B支持从文本描述生成各种分辨率(如1280x720)、宽高比和时长的视频内容,并且具备强大的长语境处理能力。例如,用户可以通过简单的文本输入,快速生成长达5秒的高清视频。此外,该模型还支持动态视频序列生成、视频到音频转换以及多主体交互的复杂场景处理。 值得一提的是,Seaweed-7B的推出不仅降低了中小团队的技术门槛,还显著提升了视频创作效率。例如,仅需40GB显存即可部署,大幅节省了硬件成本。同时,该模型还结合了字节跳动的Omnihuman多模态人偶方案,能够实现人物角色与场景的高度匹配,进一步丰富了创作的可能性。 |