当前位置: 首页 > news >正文

网站开发公司排名前十天津做网站的网络公司

网站开发公司排名前十,天津做网站的网络公司,做外贸网站流程图,全国商城网站建设优点 首先,bert的创新点在于利用了双向transformer,这就跟openai的gpt有区别,gpt是采用单向的transformer,而作者认为双向transformer更能够融合上下文的信息。这里双向和单向的区别在于,单向只跟当前位置之前的tocke…

优点

首先,bert的创新点在于利用了双向transformer,这就跟openai的gpt有区别,gpt是采用单向的transformer,而作者认为双向transformer更能够融合上下文的信息。这里双向和单向的区别在于,单向只跟当前位置之前的tocken相连,双向与当前位置之后的tocken也有连接。跟ELMo相比的优势在于,transformer对特征的提取能力比lstm要强得多。
在这里插入图片描述

模型输入

首先是对输入的句子做tocken embedding,也就是将句子映射为一维向量,可以是word2vec的结果,猜想一下,如果不是维度过高也可以是one-hot,第二部分segment embedding 是在模型训练过程中自动学习得到的,猜想这里可以用全连接,也可以用transformer,最后是position embedding,主要用以区别“我喜欢妈妈”和“妈妈喜欢我”,虽然这两句话的单词一样,但是因为位置不同,所以含义不同。
在这里插入图片描述

模型参数

BERTBASE (L=12, H=768, A=12, Total Parameters=110M)

BERTLARGE (L=24, H=1024,
A=16, Total Parameters=340M).

L表示层数,H为隐层维度,A为注意力头的数量

两种任务

Masked LM

这个任务主要是随机将某句话的某几个位置做处理,这里的处理可能是3种,80%的概率用[mask]代替,10%的概率保留原来的单词,10%的概率用其他单词代替。就像是英语考试中的完形填空
在这里插入图片描述

Next Sentence Prediction (NSP)

主要利用输入的第一个tocken[cls]和中间的tocken[sep],其中cls用来表示后面一句是否为前一句的下一句,sep表示两个句子的间隔。从文本语料库中随机选择 50% 正确语句对和 50% 错误语句对进行训练。就像是与语文中的句子排序。

参考:BERT模型的详细介绍

http://www.dinnco.com/news/48436.html

相关文章:

  • html做的网站图片横着摆放阜新网络推广
  • 盐城做网站哪家好百度推广是怎么做的
  • 德阳建设公司网站广州百度推广优化排名
  • 2017年做网站多少钱网站cms
  • 网站导航类型电商网站建设制作
  • 网站备案查询不到说明啥精准获客
  • 怎么用单位电脑做网站服务器宁波最好的推广平台
  • 临安营销型网站建设百度贴吧免费发布信息
  • 长沙房价2022年最新房价肇庆seo外包公司
  • 湖南的商城网站建设深圳网页设计公司
  • 太原市建设委员会官方网站邳州网站开发
  • 一级a做片性视频网站百度推广渠道代理
  • 建立电商网站网络营销的五大特点
  • 惠州建设局网站首页免费推广方法有哪些
  • 邯郸企业网站制作建设郑州官网网站推广优化
  • 免费直播网站开发今日特大新闻
  • 怎么查看网站有没有做推广青岛百度代理公司
  • 西安都蓝网站建设百度免费打开
  • 深圳做外贸网站公司免费关键词排名优化
  • 建设营销网站要什么seo短视频保密路线
  • 打开网站弹出qq对话框中国seo谁最厉害
  • 做我女朋友的网站广告的六种广告形式
  • 湛江住房和城乡建设部网站浏览器下载安装
  • 西安地区网站建设网络seo软件
  • 做网站真的可以赚的钱吗石家庄关键词优化平台
  • 济南怎样做网站推广无锡谷歌优化
  • 网站建设合同范本下载企业营销策划方案
  • 湛江专业建网站哪家好人员优化方案
  • 做网站学哪些语言不受限制的浏览器
  • 资料查询网站怎么做免费b站推广网站下载