ChatGPT与图对话:多模态能力初体验

释放双眼,带上耳机,听听看~!
ChatGPT最新发布了与图对话的多模态能力,该文章详细解读了ChatGPT对图片的理解能力和艺术风格识别能力,以及对其应用的展望。

ChatGPT“与图对话”初体验

ChatGPT发布语音和图像能力重大更新:要点解读、应用畅想与原文翻译

中提到:ChatGPT开放了“与图对话”的多模态能力,用户可以上传一张图片或多张图片,与ChatGPT展开基于图片的对话。想不到这么快就开放了:

ChatGPT与图对话:多模态能力初体验

ChatGPT对图片的理解能达到什么水平呢?让我们一起来测试。

单图理解:非常精确

我上传了一张我和女儿在一个室内动物园戴着动物面具的合影,让ChatGPT理解这张图片:

ChatGPT与图对话:多模态能力初体验

ChatGPT的描述是下面这样的:

ChatGPT与图对话:多模态能力初体验

它详细描述了:

  • 森林背景墙
  • 我的穿着打扮
  • 女儿的穿着打扮
  • 父女俩的动作
  • 整个画面的氛围

这理解不能说是特别准确,那简直是十分精确!那个传神的表情“✌️”真的赞!

然后可以让ChatGPT以此图片为蓝本,讲一个你想要的故事:

ChatGPT与图对话:多模态能力初体验

ChatGPT能否生成图像呢?

ChatGPT与图对话:多模态能力初体验

遗憾的是,无论是生成图片还是修改上传的图片,ChatGPT暂时还做不到。

ChatGPT能注意到更多的细节(那个插座)吗?

ChatGPT与图对话:多模态能力初体验

看来它是注意到了那个墙上的插座,而且知道它存在安全隐患,很赞!

它能注意到右上角那不太容易分辨的蜘蛛网吗?

ChatGPT与图对话:多模态能力初体验

看来是没有注意到。我提示一下,会如何?

ChatGPT与图对话:多模态能力初体验

经过提示,它注意到了蜘蛛网,不过它并不百分之百确认。看来这个部分的识别精确度比较低。

还能进一步理解吗?

ChatGPT与图对话:多模态能力初体验

嗯,能理解人物关系。

ChatGPT与图对话:多模态能力初体验

对背景森林的类型也能做比较准确的推断。

ChatGPT与图对话:多模态能力初体验

这就有点强人所难了!

总的来说,ChatGPT对单张图片的理解是相当准确的,无论是场景描述、人物关系,还是整体氛围、局部细节。

艺术风格识别:一半一半

对感兴趣的绘画作品,可以让ChatGPT做解释:

ChatGPT与图对话:多模态能力初体验

这是它对其艺术风格和内容的描述:

ChatGPT与图对话:多模态能力初体验

这的确是马赛克风格的绘画。它也知道不同画家的风格流派:

ChatGPT与图对话:多模态能力初体验

ChatGPT与图对话:多模态能力初体验

试试中国风:

ChatGPT与图对话:多模态能力初体验

ChatGPT与图对话:多模态能力初体验

不错,就是工笔画。

也有不尽人意的地方,比如将下面的“ChatGPT发布语音和图像能力重大更新:要点解读、应用畅想与原文翻译

【AI产品】Podwise:AI助我听播客

本网站的内容主要来自互联网上的各种资源,仅供参考和信息分享之用,不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益,请联系我们,我们将尽快采取行动,包括删除或更正。
AI教程

SELF-DEBUGGING:教会LLM自我调试的新方法

2023-11-20 10:33:14

AI教程

《分布式机器学习——系统、工程与实战》上架啦!

2023-11-20 10:43:14

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索