LaVi官网链接地址:https://shihaozhaozsh.github.io/LaVi-Bridge/
网站默认显示语言:英语
LaVi 介绍
LaVi-Bridge是一种专为文本到图像生成模型设计的桥接模型,可以连接各种预训练的语言模型和生成视觉模型。通过LoRA和适配器,提供了一种灵活的插拔式方法,无需修改原始语言和视觉模型的权重。该模型与各种语言模型和生成视觉模型兼容,可容纳不同的结构。在这一框架内,我们证明了通过整合更高级的模块可以明显提高文本对齐或图像质量等能力。该模型经过大量评估,证实了其有效性。
LaVi用户群体
LaVi-Bridge可用于文本到图像生成任务,特别是在需要集成更先进语言模型或视觉模型的场景。
生成真实人体视频/编辑现有视频内容/视频翻译
LaVi的核心功能
- 连接不同的语言模型和生成视觉模型
- 通过LoRA和适配器实现灵活性和插拔式集成
- 提高文本描述与生成图像的对齐度
- 提升图像质量