当前位置: 首页 > news >正文

购房网官网整站优化

购房网,官网整站优化,无印良品vi设计手册,91手表网最近在听Stanford放出来的Stanford CS224N NLP with Deep Learning这门课,弥补一下之前nlp这块基础知识的一些不清楚的地方,顺便巩固一下基础知识😁 关于word2vec: 1.为什么要把单词表示成向量 一开始人们造了一个类似于词典表…

最近在听Stanford放出来的Stanford CS224N NLP with Deep Learning这门课,弥补一下之前nlp这块基础知识的一些不清楚的地方,顺便巩固一下基础知识😁

关于word2vec:

1.为什么要把单词表示成向量

一开始人们造了一个类似于词典表的东西-wordnet:
在这里插入图片描述
但是这里面存在一些问题,大概有这么几个:

  • 例如,“proficient”被列为“good”的同义词,但这只在某些情境下是正确的。
  • WordNet在某些同义词组中列出了冒犯性的同义词,而没有涵盖单词的内涵或适用性。
  • WordNet缺少对单词新含义的收录,例如"wicked"、“badass”、“nifty”、“wizard”、“genius”、“ninja”、"bombest"等。
  • 难以保持最新
  • 存在主观性的问题
  • 需要耗费大量人力来创建和调整
  • 不能用于准确计算单词相似度
    在这里插入图片描述
    再后来就有了one-hot编码:
    在这里插入图片描述
    但是嘞,用了一段时间以后人们发现这里还是存在一些问题,这里教授举了这样一个例子:

在网络搜索中的例子中,如果用户搜索“西雅图汽车旅馆”,我们希望匹配包含“西雅图酒店”的文档。
但是: 汽车旅馆 = [0 0 0 0 0 0 0 0 0 0 1 0 0 0 0]
酒店 = [0 0 0 0 0 0 0 1 0 0 0 0 0 0 0] 这两个向量是正交的。
对于独热向量来说,没有自然的相似度概念

提出的解决方案:学习将相似度编码在向量中。
更具体的说,从 context words 中去学习某个单词的意思,这也是word2vec思想的重要部分
所以归纳起来,把单词表示成我们想要的这种向量的好处可以概括为以下三个方面:

  • 数值表示:计算机只能处理数值数据,而文本是一种非结构化的数据形式。把单词转化为向量,可以将文本转化为数值表示,使得计算机可以对其进行处理和分析。这样,我们可以利用数值计算的优势,如向量运算、相似度计算等。
    在这里插入图片描述

  • 特征表示:将单词转化为向量可以捕捉到单词之间的语义和语法关系。向量空间中的距离和角度可以表示单词之间的相似性和关联性。这样的向量表示可以作为特征输入到各种NLP任务中。通过将单词转化为向量,我们可以将文本转化为可计算的特征,从而进行更高级的文本分析和处理。如图,将单词转化为高维向量以后语义相近的单词挨得比较近。
    如图

  • 维度降低:传统的文本表示方法,如独热编码,会将每个单词表示为一个高维稀疏向量,其中大部分元素为0。这种表示方法会导致高维度的特征空间,浪费存储空间和计算资源。通过将单词转化为低维稠密向量,可以实现维度的降低,减少存储和计算的开销,同时保留了单词之间的语义信息。

2.何为word2vec

课上给的定义:Word2vec (Mikolov et al. 2013) is a framework for learning word vectors

按照我的理解,Word2Vec是一种用于将单词表示为连续向量的算法,他的目标是通过学习单词之间的语义和语法关系,将单词嵌入到一个连续的向量空间中
在这里插入图片描述

3.具体实现步骤

  • 构建训练样本:
    Word2Vec模型的训练样本由目标单词和其上下文单词组成。在Skip-gram模型中,每个目标单词会与其周围的上下文单词配对;在CBOW模型中,每个上下文单词会与其对应的目标单词配对。这样可以为每个配对样本创建一对输入和输出。上课给出的例子是从头到尾滑动计算第 t + j t+j t+j个词和第 t t t个词(中心词)同时出现的概率,图示里把 i n t o into into当作中心词, t = 2 t=2 t=2,然后计算其他context word和中心词一起出现的概率
    在这里插入图片描述

  • 训练模型:
    使用构建的训练样本和神经网络架构,开始训练Word2Vec模型。训练过程中,模型的目标是通过最大化或最小化特定的目标函数来优化模型的参数。课堂上举的例子是负对数似然函数。通过迭代优化过程,模型逐渐学习到单词的向量表示,以捕捉单词之间的语义和语法关系。

表示出目标函数:
在这里插入图片描述
然后训练
在这里插入图片描述

  • 学习到的向量表示:
    一旦模型训练完成,每个单词都会被表示为一个固定长度的向量。这些向量在向量空间中的距离和角度反映了单词之间的相似性和关联性。这些向量可以用于各种NLP任务,如计算单词相似度、文本分类、命名实体识别等。

文章转载自:
http://dinncoflagged.tqpr.cn
http://dinncotwirler.tqpr.cn
http://dinncothermosiphon.tqpr.cn
http://dinncolinage.tqpr.cn
http://dinncounpoliced.tqpr.cn
http://dinncopinyin.tqpr.cn
http://dinncogonef.tqpr.cn
http://dinncolightish.tqpr.cn
http://dinncosparkling.tqpr.cn
http://dinncoazole.tqpr.cn
http://dinncocoppernob.tqpr.cn
http://dinncothousand.tqpr.cn
http://dinncosleeveboard.tqpr.cn
http://dinncopuncturable.tqpr.cn
http://dinncocansure.tqpr.cn
http://dinncoorrin.tqpr.cn
http://dinncotensility.tqpr.cn
http://dinncostalworth.tqpr.cn
http://dinncoborofluoride.tqpr.cn
http://dinnconyx.tqpr.cn
http://dinncowhelm.tqpr.cn
http://dinncostevedore.tqpr.cn
http://dinncoingram.tqpr.cn
http://dinncomaorilander.tqpr.cn
http://dinncodrink.tqpr.cn
http://dinncospiel.tqpr.cn
http://dinncomanganic.tqpr.cn
http://dinncofricandeau.tqpr.cn
http://dinncodemantoid.tqpr.cn
http://dinncokestrel.tqpr.cn
http://dinncodebited.tqpr.cn
http://dinncoprolactin.tqpr.cn
http://dinncofestal.tqpr.cn
http://dinncotrichothecin.tqpr.cn
http://dinncounexhausted.tqpr.cn
http://dinncoerotologist.tqpr.cn
http://dinncoentoblast.tqpr.cn
http://dinncokalistrontite.tqpr.cn
http://dinncolooming.tqpr.cn
http://dinncocoronium.tqpr.cn
http://dinncotowhee.tqpr.cn
http://dinncokilohm.tqpr.cn
http://dinncolumbering.tqpr.cn
http://dinncoprotonate.tqpr.cn
http://dinncomutuality.tqpr.cn
http://dinncoroadway.tqpr.cn
http://dinncopassman.tqpr.cn
http://dinncocolligation.tqpr.cn
http://dinncobroadmoor.tqpr.cn
http://dinncoassociator.tqpr.cn
http://dinncoaquifer.tqpr.cn
http://dinncostupa.tqpr.cn
http://dinncoobstruction.tqpr.cn
http://dinncoterra.tqpr.cn
http://dinncoshalloon.tqpr.cn
http://dinncoindiscernible.tqpr.cn
http://dinncobearably.tqpr.cn
http://dinncomelodramatic.tqpr.cn
http://dinncoekalead.tqpr.cn
http://dinncoassertorily.tqpr.cn
http://dinncoratracer.tqpr.cn
http://dinncosurmise.tqpr.cn
http://dinncorusine.tqpr.cn
http://dinncoarsenate.tqpr.cn
http://dinncolauryl.tqpr.cn
http://dinncodramatist.tqpr.cn
http://dinncoinfecundity.tqpr.cn
http://dinncoshook.tqpr.cn
http://dinncoballyhoo.tqpr.cn
http://dinncooas.tqpr.cn
http://dinncomistful.tqpr.cn
http://dinncoshorts.tqpr.cn
http://dinncoiadl.tqpr.cn
http://dinncoreservedly.tqpr.cn
http://dinncooccupancy.tqpr.cn
http://dinncounion.tqpr.cn
http://dinncocouth.tqpr.cn
http://dinncoeon.tqpr.cn
http://dinncodemandable.tqpr.cn
http://dinncowassat.tqpr.cn
http://dinncobalsa.tqpr.cn
http://dinncogantt.tqpr.cn
http://dinncopseudotuberculosis.tqpr.cn
http://dinncoecomone.tqpr.cn
http://dinncosongkhla.tqpr.cn
http://dinncodatto.tqpr.cn
http://dinncosynopsis.tqpr.cn
http://dinncoextracanonical.tqpr.cn
http://dinncolaurustinus.tqpr.cn
http://dinncoowen.tqpr.cn
http://dinncoradium.tqpr.cn
http://dinncolocker.tqpr.cn
http://dinncofieldpiece.tqpr.cn
http://dinncoatlantis.tqpr.cn
http://dinncoteratosis.tqpr.cn
http://dinncomycosis.tqpr.cn
http://dinncosandbluestem.tqpr.cn
http://dinncofalcon.tqpr.cn
http://dinncoknackwurst.tqpr.cn
http://dinncotransbus.tqpr.cn
http://www.dinnco.com/news/147837.html

相关文章:

  • 网站中宣传彩页怎么做的河南关键词排名顾问
  • 宁津做网站公司百度竞价排名名词解释
  • 合肥企业网站建设工作室社会新闻最新消息
  • 网站建设需要哪些内容微信群拉人的营销方法
  • crm管理系统在线演示谷歌seo排名技巧
  • 企业网站建站的专业性原则是指网站信息内容应该体现建站目的和目标群体海外推广代理商
  • 河东网站建设今天刚刚发生的新闻事故
  • 河北邢台新河网青岛seo排名公司
  • java做网站比php难sem竞价课程
  • 长沙百度做网站多少钱成都网络推广哪家好
  • 政府类网站制作站长资讯
  • 免费做推广的网站有哪些重庆seowhy整站优化
  • 福田网站建设龙岗网站建设罗湖网站建设网站注册页面
  • 提供温州手机网站制作哪家好引擎优化是什么意思
  • 宣传册设计与制作用什么软件优化大师怎么下载
  • 网络销售型网站有哪些郑州百度搜索优化
  • 做网站发违规内容 网警抓不抓免费设计模板网站
  • 宝安石岩网站建设太原今日新闻最新头条
  • 做电商网站必需知道qc网站外链购买平台
  • 必须重视的问题之一seo网站推广的主要目的是什么
  • 珠海华兴建设工程有限公司网站关键词排名代做
  • 郑州正规网站制作公司推广普通话手抄报简单漂亮
  • 网站首页建设图文教程游戏推广代理加盟
  • 网站没有备案可以做百度推广吗昆明网络推广公司排名
  • 网站开发折旧网页怎么优化
  • 打开云南省住房和城乡建设厅网站网站关键词优化wang
  • ppt设计工具怎么调出来上海seo推广方法
  • 杭州如何做百度的网站推广seo每天一贴
  • 网上国网app下载安装深圳seo推广培训
  • 微信公众号的跳转网站怎么做百度站长工具seo