Mini官网链接地址:https://github.com/dvlab-research/MiniGemini
网站默认显示语言:英语
Mini 介绍
Mini-Gemini是由香港中文大学终身教授贾佳亚团队开发的多模态模型,具备精准的图像理解能力和高质量的训练数据。该模型结合图像推理和生成,提供不同规模的版本,性能与GPT-4和DALLE3相媲美。Mini-Gemini采用Gemini的视觉双分支信息挖掘方法和SDXL技术,通过卷积网络编码图像并利用Attention机制挖掘信息,同时结合LLM生成文本链接两个模型。
Mini用户群体
适用于需要对高清图像进行解析并用图像形式展现的任务,如面包制作过程指导、电脑图片参数对比等。
根据文本提示生成具有特定风格或主题的图像
在设计中快速迭代和测试不同的视觉效果
艺术创作中实现个性化和创意的视觉效果
Mini的核心功能
- 图像理解与生成
- 高分辨率图像处理
- 多模态输入处理
- 根据文本提示生成图像
- 图像内容分析与对比