VQAScore

释放双眼,带上耳机,听听看~!
用于评估文本到视觉生成的创新性指标和基准测试

VQAScore官网链接地址:https://linzhiqiu.github.io/papers/vqascore/

VQAScore 介绍

提出了一种新的评估指标VQAScore,能够更好地评估复杂的文本到视觉生成效果,并引入了GenAI-Bench基准测试集。VQAScore基于CLIP-FlanT5模型,能够在文本到图像/视频/3D生成评估中取得最佳性能,是一种强大的替代CLIPScore的方案。GenAI-Bench则提供了包含丰富组合语义的实际场景测试文本,可用于全面评估生成模型的性能。

VQAScore用户群体

用于评估和优化文本到视觉生成模型

从种子到成长的豆芽生长过程

面团在烤箱中膨胀变化的过程

在Minecraft虚拟环境中的建筑施工过程

VQAScore的核心功能

  • 文本到视觉生成评估
  • VQAScore评估指标
  • CLIP-FlanT5 VQA模型
  • GenAI-Bench基准测试集
本网站的内容主要来自互联网上的各种资源,仅供参考和信息分享之用,不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益,请联系我们,我们将尽快采取行动,包括删除或更正。
图像识别工具

ImagenHub

2024-4-9 15:12:21

图像识别工具

Line2Depth SD 1.5

2024-4-17 14:17:14

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索