当前位置: 首页 > news >正文

日本樱花服务器正品搜外seo

日本樱花服务器正品,搜外seo,广州做网站服务,食品网站设计方案1、masked_tokens[]、token_masks[]介绍 masked_tokens和token_masks两个列表用于存储mask处理后的token(分词)结果和对应的mask标志。 masked_tokens列表存储经过mask处理后的分词结果。 token_masks列表存储与每个分词结果对应的mask标志。 2、示例…

1、masked_tokens[]、token_masks[]介绍 

masked_tokenstoken_masks两个列表用于存储mask处理后的token(分词)结果和对应的mask标志。

  • masked_tokens列表存储经过mask处理后的分词结果。

  • token_masks列表存储与每个分词结果对应的mask标志。

2、示例说明:

例如一个 masked_tokens[0]是:

['C', 'N', '[C@H]', '(', 'c', '1', 'c', 'c', '(', 'Br', ')', 'c', 'c', 'c', '1', 'F', ')', '<MASK>', '(', '<MASK>', '<MASK>', '<MASK>', 'C', '1']

token_masks[0]是:

[False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, True, False, True, True, True, False, False]

它们的长度都是28 

3、代码示例:

下面代码就是先对句子进行了token处理,然后进行了mask处理:

# 通过正则匹配对第一个句子(sents1)进行分词,得到tokens。
tokens = self._regex_match(sents1)
# 对tokens进行mask处理
m_tokens, token_masks = self._mask_tokens(tokens, empty_mask=mask)

4、mask的类型

span mask

    def _mask_span(self, ts):curr_token = 0masked = []token_mask = []mask_bools = [True, False]weights = [self.mask_prob, 1 - self.mask_prob]sampled_mask = random.choices(mask_bools, weights=weights, k=len(ts))while curr_token < len(ts):# If mask, sample from a poisson dist to get length of maskif sampled_mask[curr_token]:mask_len = torch.poisson(torch.tensor(self.span_lambda)).long().item()masked.append(self.mask_token)token_mask.append(True)curr_token += mask_len# Otherwise don't maskelse:masked.append(ts[curr_token])token_mask.append(False)curr_token += 1return masked, token_mask

随机对某些位置进行mask,从泊松区取样得到mask的长度,mask前后序列的长度可能会发生变化

replace mask

    def _mask_replace(self, ts):mask_bools = [True, False]weights = [self.mask_prob, 1 - self.mask_prob]token_mask = random.choices(mask_bools, weights=weights, k=len(ts))masked = [self._mask_token(ts[i]) if m else ts[i] for i, m in enumerate(token_mask)]return masked, token_mask

根据权重Weight随机对某些位置进行mask,mask前后序列的长度不会发生变化

权重Weight:例如,如果设定 self.mask_prob = 0.7,则掩码标记 True 的权重为 0.7,掩码标记 False 的权重为 0.3

http://www.dinnco.com/news/20948.html

相关文章:

  • wordpress xmlrpc攻击搜狗seo优化
  • 做化妆品的网站常用的seo工具的是有哪些
  • 做门户论坛与网站的区别大连seo顾问
  • 文具网站建设规划书网络推广渠道和方式
  • 影视视频网站怎么做公司网站怎么做
  • 网站备案后可以改名吗百度一下你就知道123
  • 百度搜索网站被跳转到其他网站网站seo优化皆宣徐州百都网络不错
  • 佛山做外贸网站的网络推广运营主要做什么
  • 专业设计网站有哪些域名免费查询
  • 淮安做网站建设的网络公司关键词优化分析工具
  • 怎么样可以做网站充值代理排名轻松seo 网站推广
  • 中国4a广告公司有哪些标题优化方法
  • 在百度做推广需要网站吗搜索引擎优化趋势
  • 网站开发的公司排名如何做百度搜索推广
  • 吴忠网页设计南昌seo排名收费
  • java做网站教程视频秦皇岛seo优化
  • 公众号里的网站怎么做的站长工具seo排名查询
  • 做零食的网站seo推广软件排行榜
  • 网站建设与管理期末小米口碑营销案例
  • 不会建网站如何找做网站的公司
  • 市场监督管理局局长锦州网站seo
  • html网站的直播怎么做杭州seo招聘
  • 在一家传媒公司做网站编辑_如何?电商平台有哪些
  • seo 网站案例搜索引擎营销的案例
  • 网站建设登录长沙有实力seo优化
  • 婚纱摄影网站html怎么在百度上添加自己的店铺地址
  • 专业网站建设组织百度seo排名技术必不可少
  • 做网站加盟app推广在哪里可以接单
  • 为什么做网站备案的人态度差怎么免费制作网页
  • 管理咨询师宁波网站推广优化哪家正规