全部标签

图像理解

MiniGemini

Mini-Gemini是一个支持同时理解和生成图像的多模态大型语言模型，支持多个视觉理解基准测试，如COCO、GQA、OCR-VQA、VisualGenome。
数据挖掘工具
- 468
- 0
AI应用发布4月3日
零一万物大模型开放平台

通过API获取高品质Yi系列大模型的开放平台
API设计工具
- 803
- 0
AI应用发布3月17日
字节&复旦大学多模态理解大模型LEGO详解

本文详细介绍了字节&复旦大学多模态理解大模型LEGO的研究成果，包括模型架构、数据集生成、实验评估等方面，展示了LEGO在视频定位、图像内容解读等多模态任务中的优异表现。
AI资讯
- 675
- 0
量子位1月15日
PlotChat

与图像中的数据进行聊天和分析，通过人工智能模型进行数据理解和可视化
AI绘图
- 740
- 0
AI应用发布1月6日
Vary

Vary 是用于大规模视觉语言模型的视觉词汇扩展的官方代码实现，通过提高模型性能，具有广泛的应用价值。
图像识别工具
- 295
- 0
AI应用发布23年12月27日
Pixplain

Pixplain是一款AI驱动的可视化内容解释浏览器插件，让用户可以更好地理解图像内容并获得解释。
图像识别工具
- 88
- 0
AI应用发布23年12月27日
Chat-UniVi: 130亿参数的统一视觉语言大模型

Chat-UniVi是一个具有130亿参数的统一视觉语言大模型，能够同时处理图片和视频任务，通过动态视觉token和多尺度表征实现了卓越性能，为深度学习模型的训练和推理提供更加便捷和经济的解决方案。
AI资讯
- 611
- 0
AICMTY23年11月29日