当前位置: 首页 > news >正文

rar在线解压缩网站爱战网关键词挖掘查询工具

rar在线解压缩网站,爱战网关键词挖掘查询工具,中国十大it公司,wordpress 打赏不能用一、支持向量机 支持向量机只能做二分类任务 SVM全称支持向量机,即寻找到一个超平面使样本分成两类,且间隔最大 硬间隔:如果样本线性可分,在所有样本分类都正确的情况下,寻找最大间隔;如果出现异常值或样…

一、支持向量机

  • 支持向量机只能做二分类任务

  • SVM全称支持向量机,即寻找到一个超平面使样本分成两类,且间隔最大

  • 硬间隔:如果样本线性可分,在所有样本分类都正确的情况下,寻找最大间隔;如果出现异常值或样本线性不可分,此时硬间隔无法实现

  • 软间隔:允许部分样本,在最大间隔之内,甚至在错误的一边,寻找最大间隔;目标是尽可能保持间隔宽阔和限制间隔违例之间寻找良好的平衡

  • 惩罚系数:通过惩罚系数来控制这个平衡,C值越小,则间隔越宽,分错的样本个数也就越多;反之,C值越大,则间隔越窄,分错的样本个数越少

二、LinearSVC_API

class sklearn.svm LinearSVC(C = 1.0)
  • 示例
from plot_util import plot_decision_boundary_svc, plot_decision_boundary
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score
from sklearn.datasets import load_iris
import matplotlib.pyplot as plt
from sklearn.svm import LinearSVCX, y = load_iris(return_X_y= True)x = X[y < 2, :2]
y = y[y < 2]plt.scatter(x[y == 0, 0], x[y == 0, 1], c = 'r')
plt.scatter(x[y == 1, 0], x[y == 1, 1], c = 'b')
plt.show()# 特征处理
transform = StandardScaler()
x_tran = transform.fit_transform(x)# 模型训练
model = LinearSVC(C = 30)
model.fit(x_tran, y)
y_pre = model.predict(x_tran)
print(accuracy_score(y, y_pre))# 可视化处理
plot_decision_boundary_svc(model, axis = [-3, 3, -3, 3])
plt.scatter(x_tran[y == 0, 0], x_tran[y == 0, 1], c = 'r')
plt.scatter(x_tran[y == 1, 0], x_tran[y == 1, 1], c = 'b')
plt.show()# 模型训练
model = LinearSVC(C = 0.01)
model.fit(x_tran, y)
y_pre = model.predict(x_tran)
print(accuracy_score(y, y_pre))# 可视化处理
plot_decision_boundary_svc(model, axis = [-3, 3, -3, 3])
plt.scatter(x_tran[y == 0, 0], x_tran[y == 0, 1], c = 'r')
plt.scatter(x_tran[y == 1, 0], x_tran[y == 1, 1], c = 'b')
plt.show()

三、SVM算法原理

要去求一组参数(w, b),使其构建的超平面函数能够最优地分离两个集合

样本空间中任一点x到超平面(w, b)的距离可写成: r = w T x + b ∣ ∣ w ∣ ∣ r = \frac{w^Tx+b}{||w||} r=∣∣w∣∣wTx+b,想要找到具有最大间隔的划分超平面,也就是要找到能满足下式中约束的参数w和b,使得间隔 γ \gamma γ最大

​ $ \begin{cases} \boldsymbol{w}^{\mathrm{T}} \boldsymbol{x}{i} + b \geqslant +1, & y{i} = +1; \ \boldsymbol{w}^{\mathrm{T}} \boldsymbol{x}{i} + b \leqslant -1, & y{i} = -1. \end{cases} $

距离超平面最近的几个训练样本点使上式等号成立,他们被称为“支持向量”,两个异类支持向量到超平面的距离之和为(最大间隔距离表示): 2 ∣ ∣ w ∣ ∣ \frac{2}{||w||} ∣∣w∣∣2

  • 训练样本:$ \begin{cases} \boldsymbol{w}^{\mathrm{T}} \boldsymbol{x}{i} + b \geqslant +1, & y{i} = +1; \ \boldsymbol{w}^{\mathrm{T}} \boldsymbol{x}{i} + b \leqslant -1, & y{i} = -1. \end{cases} 则目标函数可以写成: 则目标函数可以写成: 则目标函数可以写成:max_{w, b} = \frac{2}{||w||}s.t.y_i(w^Tx_i+b) \geqslant 1,其中i=1,2,3,\dots, m$

  • 将目标函数进一步优化: m i n w , b = 1 2 ∣ ∣ w ∣ ∣ 2 s . t . y i ( w T x i + b ) ⩾ 1 , 其中 i = 1 , 2 , 3 , … , m min_{w, b} = \frac{1}{2}||w||^2 s.t.y_i(w^Tx_i+b) \geqslant 1,其中i = 1, 2, 3, \dots, m minw,b=21∣∣w2s.t.yi(wTxi+b)1,其中i=1,2,3,,m

  • 添加核函数,将目标函数转化成以下形式:KaTeX parse error: {align*} can be used only in display mode.

  • 构建拉格朗日函数:其中 α i \alpha_i αi为拉格朗日乘子(相当于 λ i \lambda_i λi):$L(w, b, \alpha) = \frac{1}{2}||w||^2-\sum_{i = 1}^{n} \alpha_i\left(1 - y_{i} \left(\boldsymbol{w}^{\mathrm{T}} \cdot \boldsymbol{\varPhi}(x_{i}) + b\right)-1\right) \dots \dots ① $

  • 要想求得极小值,上式后半部分应该取的极大值: m i n w , b m a x α L ( w , b , α ) < = = > m a x α m i n w , b L ( w , b , α ) min_{w, b}max_{\alpha}L(w, b, \alpha) <==> max_{\alpha }min_{w, b}L(w, b, \alpha) minw,bmaxαL(w,b,α)<==>maxαminw,bL(w,b,α)

  • 要找 m i n w , b L ( w , b , α ) min_{w, b}L(w, b, \alpha) minw,bL(w,b,α),既要先对 w , b w, b w,b求导

    • w w w求偏导,并令其为0: L = 1 2 ∣ ∣ w ∣ ∣ 2 − ∑ i = 1 n α i ( y i w T φ ( x i ) + y i b − 1 ) = 1 2 ∣ ∣ w ∣ ∣ 2 − ∑ i = 1 n α i y i w T φ ( x i ) + α i y i b − α i L=\frac{1}{2}||w||^2-\sum_{i = 1}^n \alpha_i(y_iw^T \varphi(x_i)+y_ib-1)=\frac{1}{2}||w||^2-\sum_{i = 1}^n \alpha_iy_iw^T \varphi(x_i)+\alpha_iy_ib-\alpha_i L=21∣∣w2i=1nαi(yiwTφ(xi)+yib1)=21∣∣w2i=1nαiyiwTφ(xi)+αiyibαi

      ∂ L ∂ w = w − ∑ i = 1 n α i y i φ ( x i ) = 0 \frac{\partial L}{\partial w}= w-\sum_{i = 1}^n\alpha_iy_i \varphi(x_i) = 0 wL=wi=1nαiyiφ(xi)=0

      得到: w = ∑ i = 1 n α i y i φ ( x i ) = 0 w =\sum_{i = 1}^n\alpha_iy_i \varphi(x_i) = 0 w=i=1nαiyiφ(xi)=0

    • 对b求偏导,并令其为0:
      L = 1 2 ∣ ∣ w ∣ ∣ 2 − ∑ i = 1 n α i y i w T φ ( x i ) + α i y i b − α i L = \frac{1}{2}||w||^2-\sum_{i = 1}^n \alpha_iy_iw^T\varphi(x_i)+\alpha_iy_ib-\alpha_i L=21∣∣w2i=1nαiyiwTφ(xi)+αiyibαi

      ∂ L ∂ b = ∑ i = 1 n α i y i = 0 \frac{\partial L}{\partial b}=\sum_{i = 1}^n\alpha_iy_i=0 bL=i=1nαiyi=0
      得到: ∑ i = 1 n α i y i = 0 \sum_{i = 1}^n\alpha _iy_i = 0 i=1nαiyi=0

  • 将上面两个求导的结果代入①式中,得到:$\begin{align*} L(\boldsymbol{w}, b, \boldsymbol{\alpha})&=\frac{1}{2}|\boldsymbol{w}|^{2}-\sum_{i = 1}^{n} \alpha_{i}(y_{i}(\boldsymbol{w}^{\mathrm{T}} \boldsymbol{\varphi}(x_{i}) + b) - 1)\ &=\frac{1}{2}\boldsymbol{w}^{\mathrm{T}}\boldsymbol{w}-\sum_{i = 1}{n}(\alpha_{i}y_{i}\boldsymbol{w}{\mathrm{T}}\boldsymbol{\varphi}(x_{i})+\alpha_{i}y_{i}b - \alpha_{i})\ &=\frac{1}{2}\boldsymbol{w}^{\mathrm{T}}\boldsymbol{w}-\sum_{i = 1}{n}\alpha_{i}y_{i}\boldsymbol{w}{\mathrm{T}}\boldsymbol{\varphi}(x_{i})-b\sum_{i = 1}^{n}\alpha_{i}y_{i}+\sum_{i = 1}^{n}\alpha_{i}\ &=\frac{1}{2}\boldsymbol{w}^{\mathrm{T}}\boldsymbol{w}-\sum_{i = 1}{n}\alpha_{i}y_{i}\boldsymbol{w}{\mathrm{T}}\boldsymbol{\varphi}(x_{i})+\sum_{i = 1}^{n}\alpha_{i}\ &=\frac{1}{2}\boldsymbol{w}^{\mathrm{T}}\sum_{i = 1}{n}\alpha_{i}y_{i}\boldsymbol{\varphi}(x_{i})-\boldsymbol{w}{\mathrm{T}}\sum_{i = 1}^{n}\alpha_{i}y_{i}\boldsymbol{\varphi}(x_{i})+\sum_{i = 1}^{n}\alpha_{i}\ &=\sum_{i = 1}^{n}\alpha_{i}-\frac{1}{2}\left(\sum_{i = 1}{n}\alpha_{i}y_{i}\boldsymbol{\varphi}(x_{i})\right){\mathrm{T}}\cdot\sum_{i = 1}^{n}\alpha_{i}y_{i}\boldsymbol{\varphi}(x_{i})\ &=\sum_{i = 1}^{n}\alpha_{i}-\sum_{i = 1}^{n}\sum_{j = 1}{n}\alpha_{i}\alpha_{j}y_{i}y_{j}\boldsymbol{\varphi}{\mathrm{T}}(x_{i})\boldsymbol{\varphi}(x_{j}) \end{align*} $

四、SVM核函数

  • 核函数作用:核函数将原始输入空间映射到新的特征空间,从而使原本线性不可分的样本可能在核空间可分
  • 核函数分类
    • 线性核: k ( x i , x j ) = x i T x j k(x_i, x_j)=x_i^Tx_j k(xi,xj)=xiTxj
    • 多项式核: k ( x i , x j ) = ( x i T x j ) d k(x_i, x_j) = (x_i^Tx_j)^d k(xi,xj)=(xiTxj)d
    • 高斯核(RBF, 径向基函数): k ( x I , x j ) = e p x ( − ∣ ∣ x i − x j ∣ ∣ 2 2 σ 2 ) k(x_I, x_j) = epx(-\frac{||x_i-x_j||^2}{2\sigma^2}) k(xI,xj)=epx(2σ2∣∣xixj2)——产生将样本投射到无限维空间的运算效果,使得原来不可分的数据变得可分,使用最多
    • 拉普拉斯核: k ( x i , x j ) = e x p ( − ∣ ∣ x i − x j ∣ ∣ 2 σ ) k(x_i, x_j)=exp(-\frac{||x_i-x_j||^2}{\sigma}) k(xi,xj)=exp(σ∣∣xixj2)
    • Sigmod核: k ( x i , x j ) = t a n h ( β x i T x j + θ ) k(x_i, x_j) = tanh(\beta x_i^Tx_j+\theta) k(xi,xj)=tanh(βxiTxj+θ)

1.高斯核

  • 公式: K ( x , y ) = e − γ ∣ ∣ x − y ∣ ∣ 2 K(x, y) = e^{-\gamma||x-y||^2} K(x,y)=eγ∣∣xy2,其中 γ = 1 2 σ 2 \gamma=\frac{1}{2\sigma^2} γ=2σ21

    • γ \gamma γ是超参数,作用与标准差相反, γ \gamma γ越大(标准差越小),高斯分布越窄, γ \gamma γ越小,高斯分布越宽
  • API( γ \gamma γ较大,过拟合; γ \gamma γ较小,欠拟合)

from sklearn.svm import SVC
SVC(kernel = 'rbf', gamma=gamma)
http://www.dinnco.com/news/19664.html

相关文章:

  • 国外做水广告网站大全海外短视频软件
  • 医院网站案例网络营销策划方案的目的
  • 武汉 酒店 网站制作烟台seo
  • 保定网站维护公司源码网
  • 企业网站网页app推广接单发布平台
  • 免费做链接的网站吗如何注册域名网站
  • 企业网站建设的主要步骤代运营
  • 网站建设规划书的空间360seo关键词优化
  • 广州地区做网站的关键词挖掘长尾词
  • 网站美工难做吗谷歌 翻墙入口
  • 建设一个微商的网站北大青鸟职业技术学院简介
  • 猪八戒网网站建设数据分析师培训机构
  • 呼和浩特市网站谷歌浏览器下载手机版官网
  • 网上营销的方式谷歌优化的网络公司
  • 网站的微信推广怎么做免费开发软件制作平台
  • 南宁网站设计运营快速排名软件seo系统
  • 网站常见程序问题站内seo是什么意思
  • 绛帐做企业网站百度关键词刷搜索量
  • 做门户网站服务器选择注册域名费用一般多少钱
  • wordpress站关注别人优化百度百科
  • 小企业网站建设方案谷歌浏览器 安卓下载2023版官网
  • 做网站优化好的网络公司网络营销主要做些什么工作
  • 双井网站建设经典品牌推广文案
  • 哪个网站在线做头像好腾讯广告投放平台官网
  • 北京网站制作推广软文营销文章
  • 长春阿凡达网站建设网络营销的优势包括
  • 做外贸怎么进入国外的网站常熟网络推广
  • 网站建设需要域名吗?网站seo优化建议
  • 西安做网站找哪家公司好营销网点机构号
  • 甘肃兰州区号关键词排名优化价格