LaVi

释放双眼,带上耳机,听听看~!
连接不同语言模型和生成视觉模型进行文本到图像生成。

LaVi官网链接地址:https://shihaozhaozsh.github.io/LaVi-Bridge/

网站默认显示语言:英语

LaVi 介绍

LaVi-Bridge是一种专为文本到图像生成模型设计的桥接模型,可以连接各种预训练的语言模型和生成视觉模型。通过LoRA和适配器,提供了一种灵活的插拔式方法,无需修改原始语言和视觉模型的权重。该模型与各种语言模型和生成视觉模型兼容,可容纳不同的结构。在这一框架内,我们证明了通过整合更高级的模块可以明显提高文本对齐或图像质量等能力。该模型经过大量评估,证实了其有效性。

LaVi用户群体

LaVi-Bridge可用于文本到图像生成任务,特别是在需要集成更先进语言模型或视觉模型的场景。

生成真实人体视频/编辑现有视频内容/视频翻译

LaVi的核心功能

  • 连接不同的语言模型和生成视觉模型
  • 通过LoRA和适配器实现灵活性和插拔式集成
  • 提高文本描述与生成图像的对齐度
  • 提升图像质量
本网站的内容主要来自互联网上的各种资源,仅供参考和信息分享之用,不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益,请联系我们,我们将尽快采取行动,包括删除或更正。
AI服装生成工具

FiT

2024-2-25 18:34:25

AI服装生成工具

FouriScale

2024-4-9 16:38:21

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索