最先进的预训练计算机视觉模型概述

ronghuaiyang

释放双眼，带上耳机，听听看~！

本文介绍了最先进的预训练计算机视觉模型，包括ResNet50、VGG19和EfficientNet，以及迁移学习的重要性。了解如何利用这些模型进行计算机视觉任务，以及为什么重复建立模型是毫无意义的。

本文正在参加http://deep Residual Learning for Image Recognition /)。该模型对ImageNet数据库中的100多万张图像进行了训练。与VGG-19一样，它可以分类多达1000个对象，网络训练的是224×224像素的彩色图像。以下是关于其大小和性能的简要信息：

尺寸：98 MB
Top-1 准确率：74.9%
Top-5 准确率：92.1%
参数数量：25,636,712

如果你比较ResNet50和VGG19，你会发现ResNet50实际上比VGG19性能更好，尽管它的复杂性更低。你也可以使用更新的版本，如ResNet101，ResNet152，ResNet50V2，ResNet101V2，ResNet152V2。

最先进的预训练计算机视觉模型概述

EfficientNet

EfficientNet是一种最先进的卷积神经网络，由谷歌在2019年的论文“efficient entnet: Rethinking Model Scaling for convolutional neural Networks”中训练并发布。EfficientNet有8种可选实现(B0到B7)，甚至最简单的EfficientNet B0也是非常出色的。通过530万个参数，实现了77.1%的最高精度性能。

最先进的预训练计算机视觉模型概述

EfficientNetB0的特性简要介绍如下：

尺寸：29 MB
Top-1 准确率：77.1%
Top-5 准确率：93.3%
参数数量：~5,300,000
深度：159

其他的计算机视觉问题的预训练模型

我们列出了四种最先进的获奖卷积神经网络模型。然而，还有几十种其他模型可供迁移学习使用。下面是对这些模型的基准分析，这些模型都可以在Keras Applications中获得。

最先进的预训练计算机视觉模型概述

总结

在一个我们可以很容易地获得最先进的神经网络模型的世界里，试图用有限的资源建立你自己的模型就像是在重复发明轮子，是毫无意义的。

相反，尝试使用这些训练模型，在上面添加一些新的层，考虑你的特殊计算机视觉任务，然后训练。其结果将比你从头构建的模型更成功。

英文原文：towardsdatascience.com/4-pre-train…

本网站的内容主要来自互联网上的各种资源，仅供参考和信息分享之用，不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益，请联系我们，我们将尽快采取行动，包括删除或更正。

{{userData.name}}已认证

最先进的预训练计算机视觉模型概述

EfficientNet

其他的计算机视觉问题的预训练模型

总结

AI生成的融资企划书引发VC疯狂追捧，未来趋势不容忽视

如何通过Colab搭建编译环境来使用OpenAI的ChatGPT

GeoSpy.ai

即梦Dreamina

Globe Explorer

Luma Dream Machine

抖音即创

Motionshop

归档

{{userData.name}}已认证

EfficientNet

其他的计算机视觉问题的预训练模型

总结

AI生成的融资企划书引发VC疯狂追捧，未来趋势不容忽视

如何通过Colab搭建编译环境来使用OpenAI的ChatGPT

CLIP模型预训练和推理方法详解

姿态估计实操记录：使用Dlib与mediapipe进行人脸姿态估计

预训练OCR大模型：开启OCR技术新时代

深度学习在工业缺陷检测中的应用详解