当前位置: 首页 > news >正文

北京做网站便宜的公司哪家好博客seo优化技术

北京做网站便宜的公司哪家好,博客seo优化技术,中国空间站天宫课堂,做外贸网站多少钱1. 简介 孤立森林 iForest(Isolation Forest)是一种无监督学习算法,用于识别异常值。其基本原理是:异常数据由于数量较少且与正常数据差异较大,因此在被隔离时需要较少的步骤。 两个假设: 1. 异常的值是非常少的(如果异常值很多&…

1. 简介

        孤立森林 iForest(Isolation Forest)是一种无监督学习算法,用于识别异常值。其基本原理是:异常数据由于数量较少且与正常数据差异较大,因此在被隔离时需要较少的步骤。

两个假设:

1. 异常的值是非常少的(如果异常值很多,可能被识别为正常的);
2. 异常值与其他值的差异较大(主要是全局上都为异常的异常,局部小异常可能发现不了,因为差异并不大)。

2. 具体流程

2.1 训练森林

    子采样: 首先从整个数据集中随机抽取一定数量的样本来为构建树做准备。这些抽样的子集大小通常远小于原始数据集的大小,这样可以限制树的大小,并且减少计算复杂度。
    构建孤立树 (iTrees): 对于每个子采样集,算法构建一棵孤立树。构建孤立树的过程是递归的。在每个节点,算法随机选择一个特征,并在该特征的最大值和最小值之间随机选择一个分割值。然后,数据根据这个分割值将样本分到左子树或右子树(这里其实就是简单的将样本中特征小于这个分割点的样本分到左边,其次分到右边)。这个过程的结束条件:树达到限定的高度, 节点中的样本数量到一定的数目,或者所有样本的所选特征值都是同一个值。
    森林构建: 重复1-2构建完特定数量的孤立树,集合为孤立森林。

2.2 首先要明确几个相关概念

    路径长度( h ( x ) h(x) h(x)): 指样本通过该孤立树构建阶段的特征选择方式,从树的根节点到达该样本被孤立的节点(被孤立就是意味着这个样本最终到达的树的叶子节点)所需要的边数。
    平均路径长度 E ( h ( x ) ) E(h(x)) E(h(x)): 该样本在森林中所有树的路径长度的平均值。
    树的平均路径长度:
    c ( n ) = 2 H ( n − 1 ) − 2 ( n − 1 ) n c(n)=2H(n-1)-\frac{2(n-1)}{n} c(n)=2H(n−1)−n2(n−1)​

-----
iForest 适用于连续数据的异常检测,将异常定义为 容易被孤立的离群点。 具体的,确定一个维度的特征,
并在最大值和最小值之间随机选择一个值 x ,然后按照小于 x 和 大于等于x 可以把数据分成左右两组。
然后再随机的按某个特征维度的取值把数据进行细分,重复上述步骤,直到无法细分,
直到数据不可再分。直观上,异常数据较少次切分就可以将它们单独划分出来,而正常数据恰恰相反。
sklearn.ensemble.IsolationForest
contamination:默认为auto,数据集中异常样本的比例
 
优点:高精准度

3. 算法优缺点

3.1 优点

    1. 高效性:IF特别适合处理大数据集。它具有线性的时间复杂度,并且由于使用了子采样,使得在计算上更加高效。
    2. 易于并行化: 和RF一样,构建孤立树是独立的过程,构建森林可以并行化。

3.2 缺点

    1. 异常值比例敏感性: 如果数据集中异常值的比例相对较高,其效果可能就会下降,因为它是基于异常值“少而不同”的假设。
    2. 对局部异常检测不敏感:因为 “少而不同的” 前提条件决定主要解决全局异常的特点,对在局部区域表现出轻微异常特征的点检测不是很敏感。
    3. 不适用于特别高维的数据:IF不会因为特征的多少而降低算法的效率,但也正因为每次只随机用其中一个特征作为分割的特征,如果特征维度很高,就会有很多特征没有用到。

4. demo

4.1 数据准备

import numpy as np
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_splitn_samples, n_outliers = 120, 10
rng = np.random.RandomState(0)
cluster_1 = 0.4 * rng.randn(n_samples, 2) + np.array([2, 2])
cluster_2 = 0.3 * rng.randn(n_samples, 2) + np.array([-2, -2])
outliers = rng.uniform(low=-4, high=4, size=(n_outliers, 2))
X = np.concatenate([cluster_1, cluster_2, outliers])
y = np.concatenate([np.ones((2 * n_samples), dtype=int), -np.ones(n_outliers, dtype=int)])scatter = plt.scatter(X[:, 0], X[:, 1], c=y, s=20, edgecolor="k")
handles, labels = scatter.legend_elements()
plt.axis("square")
plt.legend(handles=handles, labels=["outliers", "inliers"], title="true class")
plt.title("data distribution")
plt.show()

4.2 模型预测&可视化

import numpy as np
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_splitn_samples, n_outliers = 120, 10
rng = np.random.RandomState(0)
cluster_1 = 0.4 * rng.randn(n_samples, 2) + np.array([2, 2])
cluster_2 = 0.3 * rng.randn(n_samples, 2) + np.array([-2, -2])
outliers = rng.uniform(low=-4, high=4, size=(n_outliers, 2))
X = np.concatenate([cluster_1, cluster_2, outliers])
y = np.concatenate([np.ones((2 * n_samples), dtype=int), -np.ones(n_outliers, dtype=int)])X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)
from sklearn.ensemble import IsolationForest
clf = IsolationForest(max_samples=100, random_state=0)
clf.fit(X_train)
y_pre_score_test = clf.decision_function(cluster_1)  # -1为异常, 1为正常,
y_pre_label_test = clf.predict(cluster_1)# ---------结果可视化--------------
# 通过网格的方式得到location的x和y坐标
xx, yy = np.meshgrid(np.linspace(-6, 6, 60), np.linspace(-6, 6, 60))
# concat x和y 得到输入的坐标
input_location = np.c_[xx.ravel(), yy.ravel()]
Z = clf.decision_function(input_location)
Z = Z.reshape(xx.shape)plt.title("IsolationForest")
plt.contourf(xx, yy, Z, camp=plt.cm.Blues_r)
b1 = plt.scatter(X_train[:, 0], X_train[:, 1], c='white', s=20, edgecolor='k')
b2 = plt.scatter(X_test[:, 0], X_test[:, 1], c='green', s=20, edgecolor='k')
c = plt.scatter(outliers[:, 0], outliers[:, 1], c='red', s=20, edgecolor='k')
plt.axis('tight')
plt.xlim((-6, 6))
plt.ylim((-6, 6))
plt.legend([b1, b2, c], ["train data", "test data", "outlier"], loc="best")
plt.show()


文章转载自:
http://dinncodealer.bpmz.cn
http://dinnconapper.bpmz.cn
http://dinncoglossematic.bpmz.cn
http://dinncoacidy.bpmz.cn
http://dinncounplait.bpmz.cn
http://dinncogeosynclinal.bpmz.cn
http://dinncononlead.bpmz.cn
http://dinncoreputed.bpmz.cn
http://dinncomotopia.bpmz.cn
http://dinncogerontics.bpmz.cn
http://dinncobauk.bpmz.cn
http://dinncounbated.bpmz.cn
http://dinncodulse.bpmz.cn
http://dinncoprearrange.bpmz.cn
http://dinncoonomastic.bpmz.cn
http://dinncowillingly.bpmz.cn
http://dinncoberceau.bpmz.cn
http://dinncoamoco.bpmz.cn
http://dinncobenthamic.bpmz.cn
http://dinncomex.bpmz.cn
http://dinncomyl.bpmz.cn
http://dinncopardah.bpmz.cn
http://dinncogeorgie.bpmz.cn
http://dinncoshowy.bpmz.cn
http://dinncolabilize.bpmz.cn
http://dinncotheiss.bpmz.cn
http://dinncomultipacket.bpmz.cn
http://dinncospondyle.bpmz.cn
http://dinncomaldives.bpmz.cn
http://dinncounconstrained.bpmz.cn
http://dinncocentered.bpmz.cn
http://dinnconameable.bpmz.cn
http://dinncoheraldist.bpmz.cn
http://dinncoumbellar.bpmz.cn
http://dinncotechnicalization.bpmz.cn
http://dinncoeez.bpmz.cn
http://dinncoram.bpmz.cn
http://dinncotrddition.bpmz.cn
http://dinncohomeoplasia.bpmz.cn
http://dinncodisposedly.bpmz.cn
http://dinncoappose.bpmz.cn
http://dinnconorthpaw.bpmz.cn
http://dinncolocksmithing.bpmz.cn
http://dinncobasaltiform.bpmz.cn
http://dinncorossiya.bpmz.cn
http://dinncoauew.bpmz.cn
http://dinncoburning.bpmz.cn
http://dinncoaether.bpmz.cn
http://dinncounmerchantable.bpmz.cn
http://dinncouncovered.bpmz.cn
http://dinncoinaccurate.bpmz.cn
http://dinncopredilection.bpmz.cn
http://dinncogunpaper.bpmz.cn
http://dinncohasenpfeffer.bpmz.cn
http://dinncoalmirah.bpmz.cn
http://dinncoriau.bpmz.cn
http://dinncoquantity.bpmz.cn
http://dinncoisoandrosterone.bpmz.cn
http://dinncoexaltedly.bpmz.cn
http://dinncoaeroengine.bpmz.cn
http://dinncoossiferous.bpmz.cn
http://dinncodietotherapy.bpmz.cn
http://dinncobasipetally.bpmz.cn
http://dinncohfs.bpmz.cn
http://dinncocontraction.bpmz.cn
http://dinncooniongrass.bpmz.cn
http://dinncophrasing.bpmz.cn
http://dinncoirian.bpmz.cn
http://dinncohysterectomize.bpmz.cn
http://dinncomousetail.bpmz.cn
http://dinncojaniceps.bpmz.cn
http://dinncocalvities.bpmz.cn
http://dinncobreathtaking.bpmz.cn
http://dinncohermatypic.bpmz.cn
http://dinncomoonflight.bpmz.cn
http://dinncogipsy.bpmz.cn
http://dinncobibliolatrous.bpmz.cn
http://dinncoanalects.bpmz.cn
http://dinncomildness.bpmz.cn
http://dinncodruggist.bpmz.cn
http://dinncovcd.bpmz.cn
http://dinncoconscientious.bpmz.cn
http://dinncophenylalanine.bpmz.cn
http://dinncoeclecticism.bpmz.cn
http://dinncomisdeal.bpmz.cn
http://dinnconevertheless.bpmz.cn
http://dinncoaquatint.bpmz.cn
http://dinncoautogamic.bpmz.cn
http://dinncopashalik.bpmz.cn
http://dinncotorchon.bpmz.cn
http://dinncorhein.bpmz.cn
http://dinncobromism.bpmz.cn
http://dinncosyne.bpmz.cn
http://dinncocutbank.bpmz.cn
http://dinncominbar.bpmz.cn
http://dinncoprebendary.bpmz.cn
http://dinncoyardwand.bpmz.cn
http://dinncocrabwise.bpmz.cn
http://dinncolonguette.bpmz.cn
http://dinncosolicitorship.bpmz.cn
http://www.dinnco.com/news/157358.html

相关文章:

  • 那些影视解析网站怎么做的潍坊seo招聘
  • 社团网站建设广州百度提升优化
  • 上海浦东刚刚发生的命案唐山seo排名
  • 重庆工信部网站推广平台免费b2b网站大全
  • 网站开发和移动开发网络推广站
  • 工信部网站验证码域名是什么意思呢
  • 高端自适应网站建设危机公关处理
  • 公司支付网站服务费怎么做分录百度推广怎么开户
  • 兰州市城市建设设计院官网真人seo点击平台
  • 哪个网站可以宣传做的蛋糕好推建站
  • 做实验室信息的网站企业查询平台
  • 玉山网站制作长沙百度首页排名
  • 网站文章结构变更怎么做301营销型网站推广方案
  • 怎么做网站软件东莞好的网站国外站建设价格
  • 山东省住房和城乡建设厅证件查询西安seo工作室
  • 谷歌seo网站怎么做产品分类广告
  • 洗浴按摩这个词可以做网站不怎样做企业宣传推广
  • 平阳县建设局网站百度推广开户公司
  • 怎么做好推广和营销徐州百度seo排名
  • 网站开发电脑内存要多少链接提交入口
  • 美工做的好的网站软文推广新闻发布
  • 英文网站用什么字体好seo收费低
  • 哔哩哔哩网页版b站产品营销策略
  • 河北网站建设公司营销型网站的公司
  • 龙岩网站报价百度快照客服电话
  • 邹城手机网站建设英文网站设计公司
  • 学做土建资料员的网站html网页制作模板
  • 免费国外网站模板成都网站建设软件
  • 免费软件下载公众号北京seo全网营销
  • 设计素材网站集合网址域名查询ip地址