W.A.L.T官网链接地址:https://walt-video-diffusion.github.io/
网站默认显示语言:英语
W.A.L.T 介绍
W.A.L.T是一个基于transformer的实景视频生成方法,通过统一的潜在空间联合压缩图像和视频,实现跨模态的训练和生成。它使用窗注意力机制提高内存和训练效率,并在多个视频和图像生成基准测试上取得了最先进的性能。
W.A.L.T用户群体
生成高保真视频, 生成动画, 生成视频预览
输入文本描述,生成相应的实景视频
输入图像,生成含有该图像内容的视频
输入视频几帧关键帧,生成完整细致的高清视频
W.A.L.T的核心功能
- 实景视频生成
- 图像生成
- 文本到视频生成