SPRIGHT

释放双眼,带上耳机,听听看~!
提高文本到图像模型中空间一致性的解决方案

SPRIGHT官网链接地址:https://spright-t2i.github.io/

网站默认显示语言:越南语

SPRIGHT 介绍

SPRIGHT是一个致力于空间关系的大规模视觉语言数据集和模型,通过重新描述600万张图像构建,显著增加描述中的空间短语。该模型在444张包含大量物体的图像上进行微调训练,优化生成具有空间关系的图像,实现了最新水平的空间一致性,并提高图像质量评分。

SPRIGHT用户群体

SPRIGHT可广泛应用于需要生成具有合理空间布局的场景,如室内设计、平面布局、机器人环境模拟等。

一间带有壁炉的客厅,沙发在壁炉的右侧,茶几在沙发前方。

一个装满水果的篮子,苹果在左侧,香蕉在右侧,桔子在中间。

一座城市的街景,高楼大厦在道路的两侧,路中间有一个喷泉。

SPRIGHT的核心功能

  • 大规模空间关系数据集SPRIGHT
  • 在具有大量物体的图像上微调训练以优化空间一致性
  • 在多个基准测试中实现了空间一致性的最新水平
  • 提高了图像质量评分FID和CMMD;
本网站的内容主要来自互联网上的各种资源,仅供参考和信息分享之用,不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益,请联系我们,我们将尽快采取行动,包括删除或更正。
图像识别工具

MindEye2

2024-4-1 17:56:40

图像识别工具

ImagenHub

2024-4-9 15:12:21

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索