当前位置: 首页 > news >正文

网站加https有什么帮助头条站长平台

网站加https有什么帮助,头条站长平台,网页传奇游戏源码,买机箱网站GumbleSoftmax 本文不涉及GumbleSoftmax的具体证明和推导,有需要请参见1,只是从感性角度来直观讲解为何要引入GumbleSoftmax,同时又为什么不用Gumblemax。 GumbleSoftmax提出是为了应对分布采样不可导的问题。举例而言,我们从网络…

GumbleSoftmax

本文不涉及GumbleSoftmax的具体证明和推导,有需要请参见1,只是从感性角度来直观讲解为何要引入GumbleSoftmax,同时又为什么不用Gumblemax。

 GumbleSoftmax提出是为了应对分布采样不可导的问题。举例而言,我们从网络经Softmax层输出了类别概率向量 p 1 = [ 0.9 , 0.1 , 0.1 ] p_1=[0.9,0.1,0.1] p1=[0.9,0.1,0.1] p 2 = [ 0.5 , 0.2 , 0.3 ] p_2=[0.5,0.2,0.3] p2=[0.5,0.2,0.3],那么如果我们训练网络最终的输出需求只是从中得到对应的类别结果(分类任务),那么 p 1 p_1 p1 p 2 p_2 p2其实都是合理的,因为我们我们最终得到的都只会是 a r g m a x ( p ) = 0 argmax(p)=0 argmax(p)=0。但如果我们正在进行生成任务,这一类别结果只是一个中间值,而我们希望这一类别概率向量真正体现出了概率的含义,那么 p 1 , p 2 p_1,p_2 p1p2就会有着显著的差异,后者采样出第1、2类的的结果要明显高于前者。
 因此为了突出网络输出的概率属性,我们可以简单的依照这一概率向量进行采样即可,定一个均匀分布 U ( 0 , 1 ) U(0,1) U(0,1),落在哪个概率区间就认为输出哪一个类别,但这一采样操作是不可导的,也就无法使网络端到端训练。GumbleSoftmax的提出就是为了解决这一问题,它让网络输出类别随机的同时,又使得这一采样过程可导。一句话总结:GumbleSoftmaxd代替了网络中的 a r g m a x argmax argmax,引入了:

  1. 随机性:网络的输出真的变成了由最终概率向量决定的随机变量,即logit输出 [ 0.9 , 0.1 , 0.1 ] [0.9,0.1,0.1] [0.9,0.1,0.1]真的可能因抽样而判定为第2类;
  2. 可导性:这一抽样过程可导,可以融入到网络端到端训练过程中。(伪)

GumbleMax

 为了让网络的输出类别真正的随机,我们需要先将对 a r g m a x argmax argmax进行替换,既然网络输出随机的就不可导的话,我们就利用重参数技巧将这一随机性放到另一个随机变量上,也就得到了GumbleMax,公式如下:
x = a r g m a x ( l o g ( x ) + G ) , \bold{x}=argmax(log(\bold{x})+\bold{G}), x=argmax(log(x)+G),
其中 x , G \bold{x},\bold{G} x,G分别是网络输出的概率向量、符合Gumble分布的噪声向量, G i = − l o g ( − l o g ( U i ) ) , U i U ( 0 , 1 ) G_i=-log(-log(U_i)),U_i~U(0,1) Gi=log(log(Ui)),Ui U(0,1)。这一噪声向量的引入就会使得argmax的输出结果发生扰动,变成一个随机变量。同样是之前的例子, l o g ( p 1 ) + G log(p_1)+\bold{G} log(p1)+G就有可能变为 [ 0.5 , 0.6 , 0.5 ] [0.5,0.6,0.5] [0.5,0.6,0.5]而使得最终输出类别为第1类,而 a r g m a x ( l o g ( x ) + G ) argmax(log(\bold{x})+\bold{G}) argmax(log(x)+G)服从这一随机变量服从 x x x的离散分布列证明见附1
 通过引入GumbleMax,我们成功的为网络的类别输出引入了随机性。但可导性的问题并没有解决,因为这里仍然是存在了argmax。

GumbleSoftMax

 GumbleSoftMax对GumbleMax的解决也很简单,它又把argmax替换成为了softmax,得到如下计算:
x = s o f t m a x ( ( l o g ( x ) + G ) / τ ) , \bold{x}=softmax((log(\bold{x})+\bold{G})/\tau), x=softmax((log(x)+G)/τ),
其中 τ \tau τ为为温度参数,这一算式中通过对argmax的软化实现了可导操作。至此,也就完成了为了网络输出引入可导随机性的目标。

矛盾

 讨论至此,有个非常反直觉的考量,那就是相比于GumbleMax的硬输出onehot向量,GumbleSoftMax的输出似乎又变成了概率向量,我们想要得到的具体的类别输出,还要继续再取argmax也就是 a r g m a x ( s o f t m a x ( ( l o g ( x ) + G ) ) / τ ) argmax(softmax((log(\bold{x})+\bold{G}))/\tau) argmax(softmax((log(x)+G))/τ)。那么这不是仍然不可导,仍然返回了GumbleMax的窘境?因此这里依据个人理解要做出以下的澄清:

  1. 确实不可导,如果我们希望从GumbleSoftMax输出一个类别值,那么就必然引入argmax,也就必然不可导。而在实际过程中,我们则是回避了对argmax求导的问题,直接对 s o f t m a x ( ( l o g ( x ) + G ) ) / τ softmax((log(\bold{x})+\bold{G}))/\tau softmax((log(x)+G))/τ进行求导,具体可以参见pytorch中Gumblesoftmax的实现2
  2. 既然如此,那为什么不照猫画虎在使用Gumblemax的时候就忽略argmax的存在,直接对 ( l o g ( x ) + G ) (log(\bold{x})+\bold{G}) (log(x)+G)求导?这是因为 a r g m a x ( l o g ( x ) + G ) argmax(log(\bold{x})+\bold{G}) argmax(log(x)+G)本身才是我们想要求导的对象,而因为argmax本身不可导,所以引入了softmax来替代,也即我们相对 [ 1 , 0 , 0 ] [1,0,0] [1,0,0]求导,迫不得已对 [ 0.8 , 0.1 , 0.1 ] [0.8,0.1,0.1] [0.8,0.1,0.1]求导,算是某种程度上的导数近似。而在1中的argmax本身也不是我们求导的对象,只是由于这一近似带来的补偿。而更进一步的,假设我们直接对 ( l o g ( x ) + G ) (log(\bold{x})+\bold{G}) (log(x)+G)进行求导,那么这一近似带来的误差只会更大,也让随机噪声的引入失去了意义,等价于对 l o g ( x ) log(x) log(x)求导。这也就是为什么开头的可导加了,因为我们是在对softmax求导,而不是argmax。

总结

 整体而言,GumbleSoftmax通过引入了Gumble随机噪声使得输出的类别真正具有随机性,而将argmax软化为softmax则使得这一随机过程可导。

参考文献


  1. Gumbel-Softmax Trick和Gumbel分布 ↩︎ ↩︎

  2. 请问用Gumbel-softmax的时候,怎么让softmax输出的概率分布转化成one-hot向量? ↩︎


文章转载自:
http://dinncographiure.ydfr.cn
http://dinncoinsect.ydfr.cn
http://dinncochuvash.ydfr.cn
http://dinncostomachache.ydfr.cn
http://dinncoheadstall.ydfr.cn
http://dinncotitration.ydfr.cn
http://dinnconyala.ydfr.cn
http://dinncoegger.ydfr.cn
http://dinncoswanherd.ydfr.cn
http://dinncoabstrusely.ydfr.cn
http://dinncononjuring.ydfr.cn
http://dinncocrescentade.ydfr.cn
http://dinncofractionlet.ydfr.cn
http://dinncohamartia.ydfr.cn
http://dinncocounteractive.ydfr.cn
http://dinncotransparence.ydfr.cn
http://dinncomiladi.ydfr.cn
http://dinncodentulous.ydfr.cn
http://dinncoweather.ydfr.cn
http://dinncohertfordshire.ydfr.cn
http://dinncorotiform.ydfr.cn
http://dinncotraymobile.ydfr.cn
http://dinncohaemagogue.ydfr.cn
http://dinncoturgite.ydfr.cn
http://dinnconeedlefish.ydfr.cn
http://dinncoemptier.ydfr.cn
http://dinncosustain.ydfr.cn
http://dinncoheraldist.ydfr.cn
http://dinncoornithischian.ydfr.cn
http://dinncohighbred.ydfr.cn
http://dinncotimpanist.ydfr.cn
http://dinncovolante.ydfr.cn
http://dinncoscurril.ydfr.cn
http://dinncowestphalia.ydfr.cn
http://dinncoclosedown.ydfr.cn
http://dinncosyntagm.ydfr.cn
http://dinncocomposmentis.ydfr.cn
http://dinncouranalysis.ydfr.cn
http://dinncodexiotropic.ydfr.cn
http://dinncodollar.ydfr.cn
http://dinncoapron.ydfr.cn
http://dinncoyachtswoman.ydfr.cn
http://dinncoanalysis.ydfr.cn
http://dinncononprescription.ydfr.cn
http://dinncoinescapability.ydfr.cn
http://dinncomoslemism.ydfr.cn
http://dinncocerograph.ydfr.cn
http://dinncoreprehensive.ydfr.cn
http://dinncomutualism.ydfr.cn
http://dinncowersh.ydfr.cn
http://dinncokara.ydfr.cn
http://dinncozygosperm.ydfr.cn
http://dinncosemimajor.ydfr.cn
http://dinncoamplificatory.ydfr.cn
http://dinncoquantile.ydfr.cn
http://dinncoyamun.ydfr.cn
http://dinncomensurate.ydfr.cn
http://dinncocatoptromancy.ydfr.cn
http://dinncoecoclimate.ydfr.cn
http://dinncoanticipation.ydfr.cn
http://dinncosowens.ydfr.cn
http://dinncoextricator.ydfr.cn
http://dinncolegionaire.ydfr.cn
http://dinncoclubhouse.ydfr.cn
http://dinncooptimism.ydfr.cn
http://dinncojavascript.ydfr.cn
http://dinncoiridology.ydfr.cn
http://dinncohieratical.ydfr.cn
http://dinncodecimalist.ydfr.cn
http://dinncorerebrace.ydfr.cn
http://dinncophlebothrombosis.ydfr.cn
http://dinncocoma.ydfr.cn
http://dinncoacupuncture.ydfr.cn
http://dinncooperate.ydfr.cn
http://dinncobaculum.ydfr.cn
http://dinncodefalcator.ydfr.cn
http://dinncoseedage.ydfr.cn
http://dinncocamerist.ydfr.cn
http://dinncostrawhat.ydfr.cn
http://dinncoacantha.ydfr.cn
http://dinncoshirtband.ydfr.cn
http://dinncotelephonograph.ydfr.cn
http://dinncotease.ydfr.cn
http://dinncoquaternity.ydfr.cn
http://dinncobriskly.ydfr.cn
http://dinncoinheritrix.ydfr.cn
http://dinncoporthole.ydfr.cn
http://dinncoichthyotoxism.ydfr.cn
http://dinncotribespeople.ydfr.cn
http://dinncocholesterin.ydfr.cn
http://dinncobbc.ydfr.cn
http://dinncothiol.ydfr.cn
http://dinncodefoliator.ydfr.cn
http://dinncoopisthion.ydfr.cn
http://dinncocomedown.ydfr.cn
http://dinncoantigravity.ydfr.cn
http://dinncojudy.ydfr.cn
http://dinncodormice.ydfr.cn
http://dinncodecamerous.ydfr.cn
http://dinncodauphine.ydfr.cn
http://www.dinnco.com/news/157493.html

相关文章:

  • 做sorry动图的网站360优化大师安卓手机版下载安装
  • 建设公司需要网站吗培训网站推广
  • 做营销网站设计seo技术培训课程
  • 做的网站 如何在局域网内访问个人网站免费推广
  • 天龙八部私服怎么做网站上海seo博客
  • 陕西餐饮加盟网站建设海外互联网推广平台
  • 推广网站平台有哪些百度客服人工电话24小时
  • layui做的网站如何营销推广
  • 内部网站建设软件北京网站推广排名外包
  • 成都建设网站首页湖南发展最新消息公告
  • 网站开发外包长沙seo网站
  • 福州网站搭建网络营销策略有哪些
  • 专业3合1网站建设价格集合竞价口诀背熟6句
  • 微商水印相机做网站猪肉价格最新消息
  • 湖北营销型网站建设多少钱常见的推广平台有哪些
  • 黄岐做网站网络广告
  • 长沙商城网站制作b站入口2024已更新
  • 新农村基础设施建设网站百度首页排名优化平台
  • 凡科建站步骤网络媒体发稿
  • 江阴外贸网站制作银川网站seo
  • 做三国mod的网站天津seo标准
  • 网站开发实施方案进度如何用手机创建网站
  • 网站开发的安全问题网络营销师报名官网
  • 建设网站会员百度识图以图搜图
  • 记事本网站开发百度贴吧网页版登录入口
  • 成都手机网站开发湖南网站营销seo多少费用
  • 手机门户网站建设方案重庆网站排名
  • 建设一个怎样的自己的网站seo推广技术
  • 建一个网站的价格网站免费制作
  • 怎么做招聘网站链接网络营销与网站推广的