释放双眼，带上耳机，听听看~！

本文解析了深度学习模型中特征抽象的原理和Embedding的视角，以及对主线问题的思考。

以下内容仅为自己对深度学习模型的白话理解，若有误请理解并指出，感谢！

一、如何理解模型实现特征的“抽象”

Think！

请你把下面的三张图 ${x_1,x_2,x_3}$ ，划分到类别 ${y_1,y_2}$ 里。

深度学习模型的特征抽象和Embedding视角解析

我想你应该是黑人问号脸：？？？， ${y_1,y_2}$ 是个啥都不和我说，连个图的划分标准都不告诉我，我tm咋给你分类？

别急，那我现在给你几个“训练”用例：

深度学习模型的特征抽象和Embedding视角解析

我想你通过经验已经猜到了，图的划分标准是“图形的颜色”， ${y_1=绿色,y_2=黄色}$ ，所以你猜测结果应该是：

深度学习模型的特征抽象和Embedding视角解析

那如果“训练”用例是这样的呢：

深度学习模型的特征抽象和Embedding视角解析

我想你又猜到了，图的划分标准是“图形和线是否连接”， ${y_1=是,y_2=否}$ ，所以你猜测结果应该是：

深度学习模型的特征抽象和Embedding视角解析

最后再来一次，给你的“训练”用例如果是这样呢：

深度学习模型的特征抽象和Embedding视角解析

这次思考下，图的划分标准和 ${y_1,y_2}$ 是啥？

深度学习模型的特征抽象和Embedding视角解析

答案来了：图的划分标准是“图形的形状”， ${y_1=圆形,y_2=方形}$ ，如果你猜对了，那么恭喜你，你现在是一个“可靠的模型”了。

Why？

现在让我们思考下：我们为什么会划分了？很简单，因为我们看到了“训练”样本。

这到底发生了什么，为什么看到了“训练”样本就会划分了？因为我们通过大量的“训练”样本，“猜到了”划分的标准，即规则。

深度学习的模型也是如此的，未训练的模型和一开始的我们一样，一脸懵逼，只能乱给答案。但是，当我们给了足够的训练样本，并告诉它每个样本对应的标签后，它逐渐学习到了“规则”，于是可以做出判断了。

However！

不知道你有没有发现，从不同的维度，即 ${图形的颜色,图形的形状,图形和线是否连接}$ ，你可以进行不同的判断。等等，你竟然从一张图里区分出了三个不同的维度，并且你还会进行各自维度的比较！！

So

所以本质上来说，你可以通过训练样本，根据不同 维度 “抽象”出不同的“特征”，并且根据这些特征进行“规则”的学习。我想你已经理解深度学习模型的工作原理了。

二、从Embedding视角回归主线问题

什么是Embedding

先来看看谷歌的解释：

Embedding是一个相对低维的空间，可以将高维向量转换到其中。Embedding使得机器学习更容易在大规模的输入上进行，比如表示单词的稀疏向量。理想情况下，Embedding通过将语义相似的输入紧密地放置在Embedding空间中来捕获输入的一些语义。

啥啥啥，啥叫“将高维向量转换到其中”？其实就是维度的扩张啊！只不过我们直接告诉了模型，需要扩张到的维度有多少个。“语义”是啥东西？其实就是在样本在某个维度上的表现。例如刚刚的“图形的形状是圆形”。

深度学习模型的特征抽象和Embedding视角解析

回归主线问题

所以，思考一下，人与人的差别大于人与猪的差别，这句话是对是错？

深度学习模型的特征抽象和Embedding视角解析

从物种的维度来看，是错的，毕竟人和猪有生殖隔离（应该吧..）。
从思维的角度来看，“可能”是对的，某些人和另一些人思维上的不同，甚至真的大于人和猪的思维差别。

为什么要用“可能”？因为模型不可能也不应该知道“训练”样本之外的答案，它可能在“训练”样本之外表现的很好，但不会是标准答案！这也是为啥你会觉得ChatGPT有些答案回答得挺牛，但有些答案漏洞百出。

三、加餐：如何理解LSTM模型的作用

现在，我会给你一些用户的行为时序信息（按时间顺序排序的行为集合），请你观察这些行为在同一语义维度的表现。

深度学习模型的特征抽象和Embedding视角解析

可以发现，根据时序信息，我们一样可以抽取出不同的信息。例如，当时序信息足够多时，我们在 $x_3$ 可以抽取“用户的行为存在周期性”的特点（但是在 $x_1$ 和 $x_2$ 并无法观察到这个），也就可以由此认为 $x_4$ 的用户行为可能存在异常。

再想一下，我们通过什么判断周期性：行为点的相对位置。这个相对位置又是哪来的？对了，这就是模型的抽象能力。

四、总结

如何理解深度学习模型：模型通过观察训练样本，根据不同 维度 “抽象”出不同的“特征”，并且根据这些特征进行“规则”的学习，由此可以对新样本进行判断。

本网站的内容主要来自互联网上的各种资源，仅供参考和信息分享之用，不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益，请联系我们，我们将尽快采取行动，包括删除或更正。

{{userData.name}}已认证

深度学习模型的特征抽象和Embedding视角解析

一、如何理解模型实现特征的“抽象”

Think！

Why？

However！

So

二、从Embedding视角回归主线问题

什么是Embedding

回归主线问题

三、加餐：如何理解LSTM模型的作用

四、总结

基于PaddleHub和Diffsinger的音频歌声合成操作教程

Qwen-VL：阿里云研发的大规模视觉语言模型介绍

GeoSpy.ai

即梦Dreamina

Globe Explorer

Luma Dream Machine

抖音即创

StoryDiffusion

归档

{{userData.name}}已认证

一、如何理解模型实现特征的“抽象”

Think！

Why？

However！

So

二、从Embedding视角回归主线问题

什么是Embedding

回归主线问题

三、加餐：如何理解LSTM模型的作用

四、总结

基于PaddleHub和Diffsinger的音频歌声合成操作教程

Qwen-VL：阿里云研发的大规模视觉语言模型介绍

深入浅出OCR技术导论

GPT-4内幕大揭露！1.8万亿巨量参数，13万亿token训练，斥资6300万美元

Falcon 180B：世界顶级开源大模型官宣，性能直逼GPT-4

深度解析生成式人工智能：原理、应用与发展趋势