深度学习计算图与梯度求导详解

AI教程
23年12月7日
编辑

timerring

释放双眼，带上耳机，听听看~！

本文详细介绍了深度学习中计算图与梯度求导的原理和实现，以及PyTorch的动态图和静态图机制。了解计算图和梯度求导对于深度学习入门者非常重要。

持续创作，加速成长！这是我参与「掘金日新计划 · 10 月更文挑战」的第33天，点击查看活动详情

计算图

计算图是用来描述运算的有向无环图

计算图有两个主要元素：

结点 Node
边 Edge

结点表示数据：如向量，矩阵，张量

边表示运算：如加减乘除卷积等

用计算图表示：y = (x+ w) * (w+1)
a = x + w
b = w + 1
y = a * b

深度学习计算图与梯度求导详解

计算图与梯度求导

y = (x+ w) * (w+1)
a = x + w
b = w + 1
y = a * b

深度学习计算图与梯度求导详解

$\ &=b * 1+a * 1 \ &=b+a \ &=(w+1)+(x+w) \ &=2 * w+x+1 \ &=2 * 1+2+1=5 end{aligned}$

可见，对于变量w的求导过程就是寻找它在计算图中的所有路径的求导之和。

code：

import torch

w = torch.tensor([1.], requires_grad=True)
x = torch.tensor([2.], requires_grad=True)

a = torch.add(w, x)     # retain_grad()
b = torch.add(w, 1)
y = torch.mul(a, b)

y.backward()
print(w.grad)

tensor([5.])

计算图与梯度求导
y = (x+ w) * (w+1)

叶子结点：用户创建的结点称为叶子结点，如 X 与 W

is_leaf: 指示张量是否为叶子结点

叶子节点的作用是标志存储叶子节点的梯度，而清除在反向传播过程中的变量的梯度，以达到节省内存的目的。

当然，如果想要保存过程中变量的梯度值，可以采用retain_grad()

grad_fn: 记录创建该张量时所用的方法（函数）

y.grad_fn= <MulBackward0>
a.grad_fn= <AddBackward0>
b.grad_fn= <AddBackward0>

深度学习计算图与梯度求导详解

PyTorch的动态图机制

根据计算图搭建方式，可将计算图分为动态图和静态图

动态图

运算与搭建同时进行

灵活易调节

例如动态图 PyTorch：
静态

先搭建图，后运算

高效不灵活。

静态图 TensorFlow

本网站的内容主要来自互联网上的各种资源，仅供参考和信息分享之用，不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益，请联系我们，我们将尽快采取行动，包括删除或更正。

{{userData.name}}已认证

深度学习计算图与梯度求导详解

计算图

PyTorch的动态图机制

机器学习的分类和回归问题及应用案例

文心一言SDK工具包教程

GeoSpy.ai

即梦Dreamina

Globe Explorer

Luma Dream Machine

抖音即创

Motionshop

归档

{{userData.name}}已认证

计算图

PyTorch的动态图机制

机器学习的分类和回归问题及应用案例

文心一言SDK工具包教程

本地搭建AI模型-ChatGLM-6B: Pytorch安装与MinGw配置

基于深度学习的高精度狗狗检测识别系统（PyTorch+Pyside6+YOLOv5模型）

PyTorch详细实践指南：环境安装、张量操作、神经网络创建等

Pytorch手把手搭建全连接神经网络实现物品多分类