本文正在参加http://deep Residual Learning for Image Recognition /)。该模型对ImageNet数据库中的100多万张图像进行了训练。与VGG-19一样,它可以分类多达1000个对象,网络训练的是224×224像素的彩色图像。以下是关于其大小和性能的简要信息:
- 尺寸:98 MB
- Top-1 准确率:74.9%
- Top-5 准确率:92.1%
- 参数数量:25,636,712
如果你比较ResNet50和VGG19,你会发现ResNet50实际上比VGG19性能更好,尽管它的复杂性更低。你也可以使用更新的版本,如ResNet101,ResNet152,ResNet50V2,ResNet101V2,ResNet152V2。
EfficientNet
EfficientNet是一种最先进的卷积神经网络,由谷歌在2019年的论文“efficient entnet: Rethinking Model Scaling for convolutional neural Networks”中训练并发布。EfficientNet有8种可选实现(B0到B7),甚至最简单的EfficientNet B0也是非常出色的。通过530万个参数,实现了77.1%的最高精度性能。
EfficientNetB0的特性简要介绍如下:
- 尺寸:29 MB
- Top-1 准确率:77.1%
- Top-5 准确率:93.3%
- 参数数量:~5,300,000
- 深度:159
其他的计算机视觉问题的预训练模型
我们列出了四种最先进的获奖卷积神经网络模型。然而,还有几十种其他模型可供迁移学习使用。下面是对这些模型的基准分析,这些模型都可以在Keras Applications中获得。
总结
在一个我们可以很容易地获得最先进的神经网络模型的世界里,试图用有限的资源建立你自己的模型就像是在重复发明轮子,是毫无意义的。
相反,尝试使用这些训练模型,在上面添加一些新的层,考虑你的特殊计算机视觉任务,然后训练。其结果将比你从头构建的模型更成功。
英文原文:towardsdatascience.com/4-pre-train…