最先进的预训练计算机视觉模型概述

释放双眼,带上耳机,听听看~!
本文介绍了最先进的预训练计算机视觉模型,包括ResNet50、VGG19和EfficientNet,以及迁移学习的重要性。了解如何利用这些模型进行计算机视觉任务,以及为什么重复建立模型是毫无意义的。

本文正在参加http://deep Residual Learning for Image Recognition /)。该模型对ImageNet数据库中的100多万张图像进行了训练。与VGG-19一样,它可以分类多达1000个对象,网络训练的是224×224像素的彩色图像。以下是关于其大小和性能的简要信息:

  • 尺寸:98 MB
  • Top-1 准确率:74.9%
  • Top-5 准确率:92.1%
  • 参数数量:25,636,712

如果你比较ResNet50和VGG19,你会发现ResNet50实际上比VGG19性能更好,尽管它的复杂性更低。你也可以使用更新的版本,如ResNet101,ResNet152,ResNet50V2,ResNet101V2,ResNet152V2。

最先进的预训练计算机视觉模型概述

EfficientNet

EfficientNet是一种最先进的卷积神经网络,由谷歌在2019年的论文“efficient entnet: Rethinking Model Scaling for convolutional neural Networks”中训练并发布。EfficientNet有8种可选实现(B0到B7),甚至最简单的EfficientNet B0也是非常出色的。通过530万个参数,实现了77.1%的最高精度性能。

最先进的预训练计算机视觉模型概述

EfficientNetB0的特性简要介绍如下:

  • 尺寸:29 MB
  • Top-1 准确率:77.1%
  • Top-5 准确率:93.3%
  • 参数数量:~5,300,000
  • 深度:159

其他的计算机视觉问题的预训练模型

我们列出了四种最先进的获奖卷积神经网络模型。然而,还有几十种其他模型可供迁移学习使用。下面是对这些模型的基准分析,这些模型都可以在Keras Applications中获得。

最先进的预训练计算机视觉模型概述

总结

在一个我们可以很容易地获得最先进的神经网络模型的世界里,试图用有限的资源建立你自己的模型就像是在重复发明轮子,是毫无意义的。

相反,尝试使用这些训练模型,在上面添加一些新的层,考虑你的特殊计算机视觉任务,然后训练。其结果将比你从头构建的模型更成功。

英文原文:towardsdatascience.com/4-pre-train…

本网站的内容主要来自互联网上的各种资源,仅供参考和信息分享之用,不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益,请联系我们,我们将尽快采取行动,包括删除或更正。
AI教程

AI生成的融资企划书引发VC疯狂追捧,未来趋势不容忽视

2023-12-6 21:04:14

AI教程

如何通过Colab搭建编译环境来使用OpenAI的ChatGPT

2023-12-6 21:14:14

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索