核方法与高维空间映射

释放双眼，带上耳机，听听看~！

了解如何使用核方法和高维空间映射来解决非线性可分的问题，并了解在支持向量机中如何转化为凸优化问题和对偶问题。

持续创作，加速成长！这是我参与「掘金日新计划 · 10 月更文挑战」的第15天，点击查看活动详情

核方法相关的概念有三个Kernel Method（从思想角度）、Kernel Trick（从计算角度）、Kernel Function

核方法可以用于非线性带来的高维转换（从模型角度），对偶表示带来内积（从优化角度）

有时分类数据是完全不可分的，例如异或问题，即数据集为

${((0, 0), 0), ((1, 1), 0), ((1, 0), 1), ((0, 1), 1)}$

显然异或问题中的数据不是线性可分的，但我们可以将数据映射到高位空间来实现线性可分，因此我们需要寻找一个非线性的 $ϕ (x)$ 将低维空间的数据 $x$ 映射到成高维空间的数据 $z$ ，从而实现新的数据集 ${(z, y)}$ 线性可分

Cover Theonem：高维比低维更易线性可分

$ϕ (x)$ 可以是

$x=(x_{1},x_{2})overset{phi(x)}{rightarrow }z=(x_{1},x_{2},(x_{1}-x_{2})^{2})$

显然在新的空间中，新数据可以实现线性可分

在硬间隔SVM中我们将求解问题转化为凸优化问题

$}}limits_{omega,b} frac{1}{2}omega^{T}omega\&s.t.y_{i}(omega^{T}x_{i}+b)geq 1,i=1,2,cdots,Nend{aligned}right.$

进而转化为其对偶问题

$}}limits_{lambda} frac{1}{2}sumlimits_{i=1}^{N}sumlimits_{j=1}^{N}lambda_{i}lambda_{j}y_{i}y_{j}x_{i}x_{j}-sumlimits_{i=1}^{N}lambda_{i}\$

&s.t.lambda_{i}geq 0,sumlimits_{i=1}^{N}lambda_{i}y_{i}=0end{aligned}right.
$⎩ ⎨ ⎧ λ min \frac{1}{2} i = 1 \sum N j = 1 \sum N λ_{i} λ_{j} y_{i} y_{j} x_{i} x_{j} - i = 1 \sum N λ_{i} s . t . λ_{i} \geq 0, i = 1 \sum N λ_{i} y_{i} = 0$

如果我们把这里的原数据映射到高维空间实现线性可分，则问题转化为

$}}limits_{lambda} frac{1}{2}sumlimits_{i=1}^{N}sumlimits_{j=1}^{N}lambda_{i}lambda_{j}y_{i}y_{j}phi(x_{i})^{T}phi(x_{j})-sumlimits_{i=1}^{N}lambda_{i}\$

&s.t.lambda_{i}geq 0,sumlimits_{i=1}^{N}lambda_{i}y_{i}=0end{aligned}right.
$⎩ ⎨ ⎧ λ min \frac{1}{2} i = 1 \sum N j = 1 \sum N λ_{i} λ_{j} y_{i} y_{j} ϕ (x_{i})^{T} ϕ (x_{j}) - i = 1 \sum N λ_{i} s . t . λ_{i} \geq 0, i = 1 \sum N λ_{i} y_{i} = 0$

然而，如果我们将 $x$ 代入 $ϕ (x)$ ，然后计算点积 $ϕ(xi)Tϕ(xj)phi(x_{i})^{T}phi(x_{j})$ ，这个计算量是很大的，因此我们引出核函数

核函数的定义为

forall x,x’ in X,exists phi:x mapsto z\

s.t.K(x,x’)=phi^{T}(x)phi(x)=left<phi(x),phi(x’)right>

end{gathered}
$\forall x, x^{'} \in X, \exists ϕ : x \mapsto z s . t . K (x, x^{'}) = ϕ^{T} (x) ϕ (x) = ⟨ ϕ (x), ϕ (x^{'}) ⟩$

这里是直接求出 $ϕ(xi)Tϕ(xj)phi(x_{i})^{T}phi(x_{j})$ ，不需要先求 $ϕ (x)$ ，再求 $ϕ(xi)Tϕ(xj)phi(x_{i})^{T}phi(x_{j})$

这里关于核函数的定义先看看就行，后面会有更精确的定义

例如一个核函数可以定义为 $frac{(x-x’)^{2}}{2sigma^{2}}right)end{aligned}$

这里只要知道 $x, x^{'}$ 直接代入就能求出对应的 $ϕ(xi)Tϕ(xj)phi(x_{i})^{T}phi(x_{j})$

关于线性可分、允许一点点错误、严格非线性三种问题解决方法

线性可分	一点点错误	严格非线性
PLA	Pocket Algerithm	$ϕ (x)$ +PLA
Hard-Margin SVM	Soft-Margin SVM	$ϕ (x)$ +Hard-Margin SVM

本网站的内容主要来自互联网上的各种资源，仅供参考和信息分享之用，不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益，请联系我们，我们将尽快采取行动，包括删除或更正。

{{userData.name}}已认证

核方法与高维空间映射

如何利用ROC曲线确定二分类阈值分数

什么是过拟合？如何避免过拟合现象？

GeoSpy.ai

即梦Dreamina

Globe Explorer

Luma Dream Machine

抖音即创

Motionshop

归档

{{userData.name}}已认证

如何利用ROC曲线确定二分类阈值分数

什么是过拟合？如何避免过拟合现象？

机器学习优化的触觉传感器研发技术

支持向量机：突破边界，解锁分类和回归的高级技术

核方法：从线性不可分问题到高维空间映射

支持向量机(SVM)浅析：线性分类器原理与间隔最大化