Mini

释放双眼,带上耳机,听听看~!
多模态AI模型,图像理解与生成兼备

Mini官网链接地址:https://github.com/dvlab-research/MiniGemini

网站默认显示语言:英语

Mini 介绍

Mini-Gemini是由香港中文大学终身教授贾佳亚团队开发的多模态模型,具备精准的图像理解能力和高质量的训练数据。该模型结合图像推理和生成,提供不同规模的版本,性能与GPT-4和DALLE3相媲美。Mini-Gemini采用Gemini的视觉双分支信息挖掘方法和SDXL技术,通过卷积网络编码图像并利用Attention机制挖掘信息,同时结合LLM生成文本链接两个模型。

Mini用户群体

适用于需要对高清图像进行解析并用图像形式展现的任务,如面包制作过程指导、电脑图片参数对比等。

根据文本提示生成具有特定风格或主题的图像

在设计中快速迭代和测试不同的视觉效果

艺术创作中实现个性化和创意的视觉效果

Mini的核心功能

  • 图像理解与生成
  • 高分辨率图像处理
  • 多模态输入处理
  • 根据文本提示生成图像
  • 图像内容分析与对比
本网站的内容主要来自互联网上的各种资源,仅供参考和信息分享之用,不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益,请联系我们,我们将尽快采取行动,包括删除或更正。
图表生成器

Video2Game

2024-4-17 14:30:16

图表生成器

OneChart

2024-4-22 16:19:39

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索