当前位置: 首页 > news >正文

农业信息网站建设方案爱站网长尾关键词

农业信息网站建设方案,爱站网长尾关键词,wordpress渗透经验,网页设计课程总结500字Photon Hash Aggregation Vectorization Photon Hash Join 的向量化的要点是:使用开放地址法。步骤: 向量化计算 hash 值基于 hash 向量化计算 bucket 下标,得到 bucket index 向量基于 bucket index 向量中记录的下标找到 bucket&#xff…

Photon Hash Aggregation Vectorization

Photon Hash Join 的向量化的要点是:使用开放地址法。步骤:

  1. 向量化计算 hash 值
  2. 基于 hash 向量化计算 bucket 下标,得到 bucket index 向量
  3. 基于 bucket index 向量中记录的下标找到 bucket,判定是否冲突,如果冲突则继续向下,直至找到正确 bucket,将正确 bucket 下标回填到 bucket index 向量中 (Not So Vectorized)。下图中绿色就是解决冲突后找到的 bucket 位置。

在这里插入图片描述
4. 向量化计算 Aggregate 值。伪代码如下:
在这里插入图片描述
可以看到,上面几个步骤里,除了 3 里面有一些不规整的操作,其余都是非常简单的 kernel 操作。

Photon 关于 Null 的考虑

Photon 测试发现,为了处理 Null,会付出 23+% 的开销。基于如下观察:

  • 用户很少专门给列加上 Not Null 约束
  • 很多场景里虽然没有指明 Not Null 约束,但实际数据中 Null 很少

所以,Photo 给每一个 batch 的数据都附带了一个 has_nulls() 标记,如果这一批数据里面一个 null 都没有,那么这一批数据的计算就可以使用 NotNullKernel,性能最佳;反之,就回退到使用 WithNullKernel,付出必要的代价。

在这里插入图片描述
注意:这里要强调 Batch,而不是全量数据。全量数据里有少许 Null,但其中大部分 Batch 里没有 Null,就能用上上述优化。

Photon 关于 Selector / Active Rows 考虑

考虑到存在 Filter,并且 Filter 可能会过滤掉大部分数据,Photon 为过滤后的数据创建了一个 Active Rows 结构,用于索引未被过滤的数据。
增加 Active Rows 概念后,后继所有数据访问都要通过 Active Rows 索引来定位,成为框架固有开销。

另一种实现思路是引入 Skip 数组,当行过滤时,Skip[i] 被设置为 1,否则为 0。访问过滤后的数据时,需要遍历整个 skip 数组。这么做的好处是(…内存好管理?),缺点是增加了不必要的判断。

http://www.dinnco.com/news/48569.html

相关文章:

  • 怎么查网站备案信息查询手机版谷歌浏览器入口
  • 微信公众号可以做微网站域名备案查询
  • 做插画的网站友链大全
  • 网站开发 访问速度慢国内专业seo公司
  • 代理服务器软件山西seo谷歌关键词优化工具
  • 做一个电影网站需要多少钱武汉软件测试培训机构排名
  • 编程开发工具有哪些seo外包网络公司
  • 公司局域网组建方案seochinaz查询
  • 最新网站开发价格百度快速排名优化服务
  • 企业网站建设熊掌号sem专员
  • 营销型网站的好处福州关键词优化平台
  • 上海高端网站建设公司seo技术服务外包公司
  • 动漫网页设计代码seo中文全称是什么
  • 做项目的招聘网站分销平台
  • 保定做网站设计网页制作代码
  • 经营网站如何挣钱如何用手机制作网站
  • 网站的毕业设计怎么做安徽关键词seo
  • 南山住房和建设局网站百度seo按天计费
  • 青海网站制作多少钱西安网站制作公司
  • 滨江区建设局官方网站seo网站优化教程
  • 做网站不小心复制了别人的链接什么软件能搜索关键词能快速找到
  • 今天新闻摘抄十条上海站群优化
  • 会泽住房和城乡建设局网站如何做好企业网站的推广
  • 苏州网站定制购买域名后如何建立网站
  • 网站做视频怎么赚钱的百度主页入口
  • 深圳市建筑人才网seo关键词排名优化方案
  • 上海十大网站建设google在线代理
  • 西安网站建设报价方案seo点击排名源码
  • frontpage做的社交网站电商线上推广渠道
  • 做网站的挣钱么自有品牌如何推广