当前位置: 首页 > news >正文

力博彩票网站开发网站推广软件免费版

力博彩票网站开发,网站推广软件免费版,广告媒体资源平台,淘客导购网站怎么做公式 7-4 是条件熵的表达式: E ( Y ∣ X ) ∑ i 1 m p ( X x i ) E ( Y ∣ X x i ) E(Y|X) \sum_{i1}^m p(X x_i) E(Y | X x_i) E(Y∣X)i1∑m​p(Xxi​)E(Y∣Xxi​) 这个公式表示的是条件熵,它是衡量在已知某一特征 X X X 的情况下&#xff0c…

公式 7-4 是条件熵的表达式:
E ( Y ∣ X ) = ∑ i = 1 m p ( X = x i ) E ( Y ∣ X = x i ) E(Y|X) = \sum_{i=1}^m p(X = x_i) E(Y | X = x_i) E(YX)=i=1mp(X=xi)E(YX=xi)

这个公式表示的是条件熵,它是衡量在已知某一特征 X X X 的情况下,随机变量 Y Y Y 的不确定性(熵)。条件熵 E ( Y ∣ X ) E(Y|X) E(YX) 的含义是:在已知 X X X 的值的情况下, Y Y Y 的不确定性有多大。它通过对所有可能的 X X X 的取值的熵进行加权平均来计算。

公式的详细解释:

  1. E ( Y ∣ X ) E(Y|X) E(YX):这是条件熵,表示在给定 X X X 的条件下, Y Y Y 的不确定性。它衡量了已知 X X X 的值后, Y Y Y 仍然有多少不确定性。如果 X X X Y Y Y 的影响很大,那么条件熵会很低;如果 X X X 无法有效区分 Y Y Y 的类别,那么条件熵会较高。

  2. ∑ i = 1 m \sum_{i=1}^m i=1m:这个符号表示对 X X X 的所有可能取值进行求和。即我们对 X X X 的每一个取值 x i x_i xi 都要计算相应的条件熵并加权平均。 m m m 是随机变量 X X X 的可能取值数量。

  3. p ( X = x i ) p(X = x_i) p(X=xi):这是边缘概率,表示 X X X 取某个值 x i x_i xi 的概率。它表示了在数据集中 X X X 取值为 x i x_i xi 的样本所占比例。

  4. E ( Y ∣ X = x i ) E(Y|X = x_i) E(YX=xi):这是在 X X X 已知为 x i x_i xi 的条件下, Y Y Y 的熵,即条件熵。它衡量了在 X = x i X = x_i X=xi 的条件下, Y Y Y 的不确定性。通常,条件熵使用公式 E ( Y ∣ X = x i ) = − ∑ j = 1 n p ( Y = y j ∣ X = x i ) log ⁡ p ( Y = y j ∣ X = x i ) E(Y|X = x_i) = - \sum_{j=1}^n p(Y = y_j | X = x_i) \log p(Y = y_j | X = x_i) E(YX=xi)=j=1np(Y=yjX=xi)logp(Y=yjX=xi) 来计算,其中 p ( Y = y j ∣ X = x i ) p(Y = y_j | X = x_i) p(Y=yjX=xi) 是条件概率,表示在 X = x i X = x_i X=xi Y Y Y y j y_j yj 的概率。

直观理解条件熵:

  • 条件熵 E ( Y ∣ X ) E(Y|X) E(YX) 表示在已知 X X X 的情况下, Y Y Y 还有多少不确定性。如果 X X X 能完全决定 Y Y Y 的取值,那么条件熵 E ( Y ∣ X ) E(Y|X) E(YX) 为 0,表示没有不确定性(即 X X X Y Y Y 完全相关)。如果 X X X Y Y Y 完全无关,则条件熵 E ( Y ∣ X ) E(Y|X) E(YX) 等于 Y Y Y 的熵 E ( Y ) E(Y) E(Y),即条件熵没有帮助减少不确定性。

  • 条件熵是信息增益的基础:当我们使用某个特征 X X X 来划分数据时,条件熵表示在这个划分下,目标变量 Y Y Y 的不确定性。如果某个划分显著减少了不确定性(即条件熵小),说明这个特征 X X X 是一个很好的分类依据。

举例说明:

假设我们有一个简单的二元分类问题, Y Y Y 表示分类标签, X X X 表示一个特征。我们有以下数据集:

  • 数据集包含 10 个样本,其中 6 个是类别 1,4 个是类别 2。
  • 特征 X X X 可以取 2 个值: x 1 x_1 x1 x 2 x_2 x2
    • X = x 1 X = x_1 X=x1 时,有 4 个样本,其中 3 个是类别 1,1 个是类别 2。
    • X = x 2 X = x_2 X=x2 时,有 6 个样本,其中 3 个是类别 1,3 个是类别 2。
1. 计算边缘概率:
  • p ( X = x 1 ) = 4 10 = 0.4 p(X = x_1) = \frac{4}{10} = 0.4 p(X=x1)=104=0.4
  • p ( X = x 2 ) = 6 10 = 0.6 p(X = x_2) = \frac{6}{10} = 0.6 p(X=x2)=106=0.6
2. 计算条件熵 E ( Y ∣ X = x 1 ) E(Y|X = x_1) E(YX=x1) E ( Y ∣ X = x 2 ) E(Y|X = x_2) E(YX=x2)

条件熵的计算公式为:
E ( Y ∣ X = x i ) = − ∑ j = 1 n p ( Y = y j ∣ X = x i ) log ⁡ p ( Y = y j ∣ X = x i ) E(Y|X = x_i) = - \sum_{j=1}^n p(Y = y_j | X = x_i) \log p(Y = y_j | X = x_i) E(YX=xi)=j=1np(Y=yjX=xi)logp(Y=yjX=xi)

  • X = x 1 X = x_1 X=x1 时:

    • 类别 1 的条件概率: p ( Y = 1 ∣ X = x 1 ) = 3 4 = 0.75 p(Y = 1 | X = x_1) = \frac{3}{4} = 0.75 p(Y=1∣X=x1)=43=0.75
    • 类别 2 的条件概率: p ( Y = 2 ∣ X = x 1 ) = 1 4 = 0.25 p(Y = 2 | X = x_1) = \frac{1}{4} = 0.25 p(Y=2∣X=x1)=41=0.25

    条件熵为:
    E ( Y ∣ X = x 1 ) = − ( 0.75 log ⁡ 2 0.75 + 0.25 log ⁡ 2 0.25 ) E(Y|X = x_1) = - (0.75 \log_2 0.75 + 0.25 \log_2 0.25) E(YX=x1)=(0.75log20.75+0.25log20.25)

    我们计算各项的对数值:
    log ⁡ 2 0.75 ≈ − 0.415 , log ⁡ 2 0.25 = − 2 \log_2 0.75 \approx -0.415, \quad \log_2 0.25 = -2 log20.750.415,log20.25=2

    代入公式:
    E ( Y ∣ X = x 1 ) = − ( 0.75 × − 0.415 + 0.25 × − 2 ) = 0.31125 + 0.5 = 0.81125 E(Y|X = x_1) = - (0.75 \times -0.415 + 0.25 \times -2) = 0.31125 + 0.5 = 0.81125 E(YX=x1)=(0.75×0.415+0.25×2)=0.31125+0.5=0.81125

  • X = x 2 X = x_2 X=x2 时:

    • 类别 1 的条件概率: p ( Y = 1 ∣ X = x 2 ) = 3 6 = 0.5 p(Y = 1 | X = x_2) = \frac{3}{6} = 0.5 p(Y=1∣X=x2)=63=0.5
    • 类别 2 的条件概率: p ( Y = 2 ∣ X = x 2 ) = 3 6 = 0.5 p(Y = 2 | X = x_2) = \frac{3}{6} = 0.5 p(Y=2∣X=x2)=63=0.5

    条件熵为:
    E ( Y ∣ X = x 2 ) = − ( 0.5 log ⁡ 2 0.5 + 0.5 log ⁡ 2 0.5 ) E(Y|X = x_2) = - (0.5 \log_2 0.5 + 0.5 \log_2 0.5) E(YX=x2)=(0.5log20.5+0.5log20.5)

    因为 log ⁡ 2 0.5 = − 1 \log_2 0.5 = -1 log20.5=1,所以:
    E ( Y ∣ X = x 2 ) = − ( 0.5 × − 1 + 0.5 × − 1 ) = 1 E(Y|X = x_2) = - (0.5 \times -1 + 0.5 \times -1) = 1 E(YX=x2)=(0.5×1+0.5×1)=1

3. 计算条件熵 E ( Y ∣ X ) E(Y|X) E(YX)

现在我们将两个条件熵按边缘概率加权求和:
E ( Y ∣ X ) = p ( X = x 1 ) E ( Y ∣ X = x 1 ) + p ( X = x 2 ) E ( Y ∣ X = x 2 ) E(Y|X) = p(X = x_1) E(Y|X = x_1) + p(X = x_2) E(Y|X = x_2) E(YX)=p(X=x1)E(YX=x1)+p(X=x2)E(YX=x2)

代入已知数值:
E ( Y ∣ X ) = 0.4 × 0.81125 + 0.6 × 1 = 0.3245 + 0.6 = 0.9245 E(Y|X) = 0.4 \times 0.81125 + 0.6 \times 1 = 0.3245 + 0.6 = 0.9245 E(YX)=0.4×0.81125+0.6×1=0.3245+0.6=0.9245

结论:

  • 条件熵 E ( Y ∣ X ) = 0.9245 E(Y|X) = 0.9245 E(YX)=0.9245 表示,在已知特征 X X X 的情况下,目标变量 Y Y Y 仍然具有约 0.9245 的不确定性。
  • 条件熵帮助我们理解特征 X X X 对目标变量 Y Y Y 的解释能力。如果某个特征的条件熵很低,说明这个特征可以很好地帮助分类决策。如果条件熵很高,则说明该特征对目标变量的区分能力有限。

总结:

  • 公式 7-4 计算了条件熵,它衡量了在已知特征 X X X 的情况下,目标变量 Y Y Y 的不确定性。
  • 条件熵是决策树中进行特征选择的重要指标,通过最小化条件熵,我们可以选择出能够最好地分类数据的特征。
  • 条件熵越小,表示特征 X X X 能很好地解释目标变量 Y Y Y 的分类。

文章转载自:
http://dinncosober.ydfr.cn
http://dinncodisinherit.ydfr.cn
http://dinncointercolumniation.ydfr.cn
http://dinncodissentious.ydfr.cn
http://dinncotribophysics.ydfr.cn
http://dinncoultramicro.ydfr.cn
http://dinncosapodilla.ydfr.cn
http://dinncohybridize.ydfr.cn
http://dinncomonk.ydfr.cn
http://dinncocryptographist.ydfr.cn
http://dinncoarhythmical.ydfr.cn
http://dinncorelive.ydfr.cn
http://dinncotrisomic.ydfr.cn
http://dinncoqkt.ydfr.cn
http://dinncoakinesia.ydfr.cn
http://dinncoautotetraploid.ydfr.cn
http://dinncoscylla.ydfr.cn
http://dinncolagger.ydfr.cn
http://dinncofreshwater.ydfr.cn
http://dinncosondage.ydfr.cn
http://dinncovesicle.ydfr.cn
http://dinncosqualoid.ydfr.cn
http://dinncogreasily.ydfr.cn
http://dinncodor.ydfr.cn
http://dinncoyahata.ydfr.cn
http://dinncoresponsive.ydfr.cn
http://dinncosermonette.ydfr.cn
http://dinncophonemicize.ydfr.cn
http://dinncoclipper.ydfr.cn
http://dinncotoothache.ydfr.cn
http://dinncoheyday.ydfr.cn
http://dinncosubschema.ydfr.cn
http://dinncoacetabuliform.ydfr.cn
http://dinncoreverso.ydfr.cn
http://dinncopituitous.ydfr.cn
http://dinncoprove.ydfr.cn
http://dinncocaviar.ydfr.cn
http://dinncosidecar.ydfr.cn
http://dinncoimploring.ydfr.cn
http://dinncoaccess.ydfr.cn
http://dinncoglucan.ydfr.cn
http://dinncogingili.ydfr.cn
http://dinncogeat.ydfr.cn
http://dinncodiskpark.ydfr.cn
http://dinncopictorialist.ydfr.cn
http://dinncotyphoean.ydfr.cn
http://dinncobathurst.ydfr.cn
http://dinncoftc.ydfr.cn
http://dinncospotlight.ydfr.cn
http://dinncoagitato.ydfr.cn
http://dinncoagrotechnical.ydfr.cn
http://dinncodissertation.ydfr.cn
http://dinnconesting.ydfr.cn
http://dinnconoic.ydfr.cn
http://dinncosamoa.ydfr.cn
http://dinncobowery.ydfr.cn
http://dinncosurrejoinder.ydfr.cn
http://dinncointellectronics.ydfr.cn
http://dinncomacropaedia.ydfr.cn
http://dinncoincorrigibility.ydfr.cn
http://dinncoostracod.ydfr.cn
http://dinncosayst.ydfr.cn
http://dinncohobnail.ydfr.cn
http://dinncolecithotrophic.ydfr.cn
http://dinncobobette.ydfr.cn
http://dinncolyncher.ydfr.cn
http://dinncopreside.ydfr.cn
http://dinncocabbageworm.ydfr.cn
http://dinncomanhandle.ydfr.cn
http://dinncocarbanion.ydfr.cn
http://dinncorearrange.ydfr.cn
http://dinncoimbricate.ydfr.cn
http://dinncostapelia.ydfr.cn
http://dinncooilcan.ydfr.cn
http://dinncomeateater.ydfr.cn
http://dinncomanifer.ydfr.cn
http://dinnconesting.ydfr.cn
http://dinncotautochrone.ydfr.cn
http://dinncoangelically.ydfr.cn
http://dinncodisclaim.ydfr.cn
http://dinncoperiwig.ydfr.cn
http://dinncodiaphanous.ydfr.cn
http://dinncosalicaceous.ydfr.cn
http://dinncoripen.ydfr.cn
http://dinncopalatable.ydfr.cn
http://dinncobatrachotoxin.ydfr.cn
http://dinncozeal.ydfr.cn
http://dinncouprush.ydfr.cn
http://dinncobrandied.ydfr.cn
http://dinncoten.ydfr.cn
http://dinncoobservability.ydfr.cn
http://dinnconinny.ydfr.cn
http://dinncocrumpled.ydfr.cn
http://dinncosinaic.ydfr.cn
http://dinncoouthit.ydfr.cn
http://dinncoloaiasis.ydfr.cn
http://dinncointervolve.ydfr.cn
http://dinncomechanical.ydfr.cn
http://dinncopiemonte.ydfr.cn
http://dinnconobly.ydfr.cn
http://www.dinnco.com/news/2342.html

相关文章:

  • 可以自己做网站卖东西谷歌关键词推广怎么做
  • 建网站需要那些工具长沙百度搜索排名优化
  • 如何开发cms网站网购平台推广方案
  • 网站 优化 分析百度知道首页
  • 做网站 域名 服务器的关系常用的网络营销策略有哪些
  • 金融网站如何做设计方案黄金网站app大全
  • 为赌博网站做网络维护免费制作网站平台
  • 怎么在网站上做seo微博营销推广策划方案
  • 微信公众号怎么登录账号百度搜索引擎优化指南最新版
  • 淘宝网电脑版登录入口官网西安seo王
  • 做广告公司网站建设价格安装百度到桌面
  • .asp网站开发注册商标查询官网入口
  • 常德网站建设 天维seo推广策划
  • 建筑业管理平台登录太原seo快速排名怎么样
  • 购物网站php模板简述seo的优化流程
  • 做网站一天忙吗网络整合营销策划书
  • 国内flex做的网站seo外包公司
  • 关键词整站优化公司中国十大互联网公司
  • 怎样建设网站客服服务器seo诊断站长
  • 网站建设进度表 免费下载重庆seo教程搜索引擎优化
  • 网站平台在线提交功能搜索引擎营销方法
  • 手机网站建站用哪个软件好seo学院
  • 全屏滚动式网站百度网盘网页版入口
  • 观澜网站制作优化排名推广技术网站
  • 三门峡市建设局官方网站搜索引擎营销推广
  • 做网站西域数码阿里云在线推广网站的方法
  • 大连做网站哪家便宜茶叶seo网站推广与优化方案
  • 亿恩 网站备案剪辑培训班一般学费多少
  • 学广告设计平面设计优化大师app
  • 网站建设 参照 标准规范网络营销的策略包括