快手视频生成大模型「可灵」近日亮相,并已在其旗下的快影App开放邀测体验。根据多方报道,可灵大模型是由快手AI团队自研,基于快手在视频技术方面的多年积累,采用了与Sora相似的技术路线,并结合了多项自研技术创新。
可灵大模型具备以下显著优势: 高分辨率和长时长:生成的视频分辨率最高可达1080p,时长最长为2分钟(帧率30fps),并支持自由调整宽高比。 物理世界模拟能力:该模型能够生成具有合理运动和模拟物理世界特性的视频,这意味着它可以在视频中实现复杂的动作和环境互动。 强大的概念组合能力和想象力:可灵大模型不仅能够处理复杂的视觉内容,还具备强大的概念组合能力和想象力,使其在创意视频制作方面表现出色。 此外,快手还在可灵大模型中加入了自研的3D人脸重建技术、背景稳定性和重定向模块,以及“AI唱跳”技术,这些技术的结合使得生成的视频更加生动和真实。 总体来看,可灵大模型的推出标志着快手在视频生成领域的一个重要进展,其技术水平和应用潜力都显示出了与国际先进水平相当的竞争力。 |