MobileDiffusion官网链接地址:https://huggingface.co/papers/2311.16567
MobileDiffusion 介绍
MobileDiffusion是一个轻量级的潜在扩散模型,专为移动设备设计,能在0.5秒内根据文本提示生成512×512高质量图像。相较于其他文本到图像模型,它更小巧(仅520M参数),非常适合在手机上部署使用。主要使用场景包括内容创作、艺术创作、游戏和App开发等领域。示例使用包括:输入’盛开的玫瑰花’生成玫瑰花图片,输入’金色 retrievier 撒欢跑’生成小狗图片,输入’火星风景,外太空’生成火星图。相较于其他大模型,它更适合在移动设备上部署使用。
MobileDiffusion用户群体
内容创作,艺术创作,游戏和App
一个摄影师需要为他的视频配乐,他可以使用 A.V. MAPPING 上传视频并找到与之匹配的音乐。
一位编剧需要为他的电影剧本找到合适的背景音乐,他可以使用 A.V. MAPPING 通过文本搜索功能找到匹配的音乐。
一位创作者想要在 Web3.0 虚拟世界中举办音乐会,他可以与 A.V. MAPPING 合作领导比赛和音乐会。
MobileDiffusion的核心功能
- 基于文本生成图像
- 快速生成(0.5秒内)
- 小巧的参数量(520M)
- 高质量的生成效果