评估文本到视觉生成模型的创新性指标和基准测试

VQAScore

释放双眼，带上耳机，听听看~！

用于评估文本到视觉生成的创新性指标和基准测试

VQAScore官网链接地址：https://linzhiqiu.github.io/papers/vqascore/

VQAScore 介绍

提出了一种新的评估指标VQAScore,能够更好地评估复杂的文本到视觉生成效果,并引入了GenAI-Bench基准测试集。VQAScore基于CLIP-FlanT5模型,能够在文本到图像/视频/3D生成评估中取得最佳性能,是一种强大的替代CLIPScore的方案。GenAI-Bench则提供了包含丰富组合语义的实际场景测试文本,可用于全面评估生成模型的性能。

VQAScore用户群体

用于评估和优化文本到视觉生成模型

从种子到成长的豆芽生长过程

面团在烤箱中膨胀变化的过程

在Minecraft虚拟环境中的建筑施工过程

VQAScore的核心功能

文本到视觉生成评估
VQAScore评估指标
CLIP-FlanT5 VQA模型
GenAI-Bench基准测试集

本网站的内容主要来自互联网上的各种资源，仅供参考和信息分享之用，不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益，请联系我们，我们将尽快采取行动，包括删除或更正。

{{userData.name}}已认证

VQAScore

VQAScore 介绍

VQAScore用户群体

VQAScore的核心功能

ImagenHub

Line2Depth SD 1.5

GeoSpy.ai

即梦Dreamina

Globe Explorer

Luma Dream Machine

抖音即创

Motionshop

归档

{{userData.name}}已认证

VQAScore 介绍

VQAScore用户群体

VQAScore的核心功能

ImagenHub

Line2Depth SD 1.5

A Vision Check

SIGNeRF

Ai Face Blur

STLST