全部标签

ViT

AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE

本文介绍了Vision Transformer（ViT）的网络结构及整体流程，以及在图像识别领域的应用。
AI教程
- 297
- 0
Howe23年12月10日
Going Deeper with Image Transformers: Exploring the Potential of Transformer Models in Image Processing

This article explores the potential of using Transformer models in image processing, drawing inspiration from the concept of residual connections in deep neural networks. It discusses the core contrib…
AI教程
- 151
- 0
小小杨树23年11月29日
Swin Transformer：打败VIT的新一代图像预训练模型

本文介绍了Swin Transformer作为一种新的图像预训练模型，相比于VIT，在分割和检测等任务上展现了更好的效果。文章详细解释了VIT的缺陷以及Swin Transformer所做的改进，包括对同一实体尺寸变化问题和高分辨率图像计算复杂度的解决方案。
AI教程
- 404
- 0
猛猿23年11月28日
基于CNN的MAE自监督方法Spark

本文介绍了基于CNN的MAE自监督方法Spark，通过稀疏卷积实现了和ViT类似的效果，并在各种下游任务中取得了SOTA的结果。
AI教程
- 54
- 0
华为云开发者联盟23年11月24日

❯

解锁会员权限

个人中心

购物车

优惠劵

今日签到

有新私信私信列表

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部