当前位置: 首页 > news >正文

网站seo怎么做如何自己做一个网站

网站seo怎么做,如何自己做一个网站,网站开发集成软件,有路由器做网站1 背景 由于计算资源限制,目前的LLM大多在较短的上下文长度中进行训练,在推理中,如果超出预训练的长度,模型的性能将会显著降低 ——>需要一个可提供外推性的位置编码最经典的绝对位置编码就是原始Transformer中的那个sinusoi…

1 背景

  • 由于计算资源限制,目前的LLM大多在较短的上下文长度中进行训练,在推理中,如果超出预训练的长度,模型的性能将会显著降低
    • ——>需要一个可提供外推性的位置编码
  • 最经典的绝对位置编码就是原始Transformer中的那个sinusoidal位置编码了:

 2 RoPE

2.1 motivation

  • RoPE通过绝对位置编码实现相对位置编码
    • 以实现有效外推
  • 我们现在有query词向量q,对应的位置m;key词向量k,对应的位置n
    • 我们希望学一个词向量和位置信息结合的函数f【经典Transformer的f是用m,n计算sinusoidal位置编码,然后将位置编码向量和q/k相加】
    • 经过f后得到的query向量和key向量都是位置感知的词向量f(q,m),f(k,n)
  • RoPE希望f(q,m),f(k,n)之间的点积能够带有相对位置信息m-n
    • 也就是希望存在另一个函数,使得:

2.2 RoPE的f函数

2.2.1 二维向量

  • 对于二维词向量,结论是:
    • 这里θ是一个常数
  • 此时

2.2.2 多维向量 

在原始论文Roformer: Enhanced Transformer With Rotray Position Embedding中,这里直接\theta_i=10000^{-\frac{2i}{d}}

所以有:

上面的矩阵乘法等价于如下的实现方式

http://www.dinnco.com/news/15771.html

相关文章:

  • 做暖网站廊坊百度seo公司
  • 做网站的教学视频长春seo快速排名
  • 网站为什么做重定向惠州seo报价
  • 360免费网站建设网络营销的特点有
  • 内蒙古网上办事大厅官网网站seo优化软件
  • 彩票网站的代理怎么做seo按照搜索引擎的
  • 有域名 有固定ip怎么做网站网络推广优化方案
  • wordpress整合问答系统seo项目完整流程
  • 做网站域名是赠送的吗营销技巧和营销方法视频
  • 外语网站开发短视频剪辑培训班多少钱
  • 营业执照申请网站电商网站建设平台
  • 网站 一般 用什么空间哈尔滨最新信息
  • 软件网站关键词优化最好用的搜索引擎排名
  • 做网站利润旺道智能seo系统
  • wordpress 空行网站页面优化内容包括哪些
  • 防止服务器上的网站被进攻网络营销公司经营范围
  • 页面设计介绍信息如何优化上百度首页
  • 一个商城网站开发周期外呼系统电销
  • 网站增加权重吗seocms
  • 湖南省人民政府网站官网农产品推广方案
  • 企业网站pr值低怎么办磁力帝
  • 网站建设什么公司好特色产品推广方案
  • 做爰全过程免费的网站视频百度竞价推广自己可以做吗
  • 通用网址查询网站今日要闻
  • 毕设代做有哪些靠谱网站今天最新消息
  • 如何购买网站虚拟主机短链接在线生成免费
  • 国内大的做网站的公司广州网站制作公司
  • 怎么做asp动态网站企业培训课程体系
  • 河南软件开发app制作公司营销网站seo推广
  • 有男女做暖暖的视频网站seo课堂