当前位置: 首页 > news >正文

做网站日志步骤网络培训平台有哪些

做网站日志步骤,网络培训平台有哪些,网站建设公司山而,简历模板免费下载word格式背景: 做数据质量检核任务的时候,有些数据表有数据,直接查hive执行select count(1) from table返回的值一直是0 问题原因: hive通过select count(1)或者select count(*) 查询的是元数据库里面的rownum,如果数据表数据是通过load、…

背景:

   做数据质量检核任务的时候,有些数据表有数据,直接查hive执行select count(1) from table返回的值一直是0

问题原因:

   hive通过select count(1)或者select count(*) 查询的是元数据库里面的rownum,如果数据表数据是通过load、put等方式加载进去的,元数据库里面的rownum没有收集统计信息,导致数据不对。

解决:

1、hive部署的时候,开启统计功能

hive.compute.query.using.stats:该属性的默认值为false。如果设置为true,Hive在执行某些查询时,例如select count(1),只利用元数据存储中保存的状态信息返回结果。为了收集基本状态信息,需要将hive.stats.autogather属性配置为true。为了收集更多的状态信息,需要运行analyzetable查询命令。

设置

hive.stats.autogather = true

2、临时方案

方案一:

使用analyze table来执行统计过程,datax或者flinkx同步数据,最后需要执行这个

ANALYZE TABLE tableName  COMPUTE  STATISTICS;  

这个也不是永久生效,如果执行之后,又put或者load数据量还是不对,还要再次执行这个sql

方案二:

窗口级别生效

set hive.compute.query.using.stats=false;
select count(1)  from tableName;

http://www.dinnco.com/news/50111.html

相关文章:

  • 做个营销型网站营销心得体会感悟300字
  • 适合大学生做的兼职网站广告优化师的工作内容
  • 建站推广网站排名百度指数查询入口
  • 东莞营销网站建设专门做排行榜的软件
  • 制作一个网站都需要学什么网络营销推广技术
  • 昆山做网站价格seo攻略
  • 新疆做网站哪家公司好关键词优化的策略有哪些
  • 怎样自己搭建一个做影视的网站baidu百度首页
  • 买空间域名做网站海南百度推广总代理商
  • 软件开发过程五个步骤谷歌搜索引擎优化seo
  • 做鸭服务的网站或群推广工具
  • 长春制作网站定制手游推广去哪里找客源
  • 经验丰富的网站制作公司东营网站建设制作
  • 做海报免费素材网站有哪些百度置顶广告多少钱
  • 求一个做交通分析的底图网站怎么开个人网站
  • 可以玩小游戏的网站百度引流平台
  • 思坎普网站建设网上代写文章一般多少钱
  • 广东网站设计专业团队app推广接单平台有哪些
  • 南山品牌网站建设企业怎么提高关键词搜索权重
  • 做交通事故的网站做一个网站需要什么
  • 建筑设计师专业网站南昌seo排名扣费
  • 疫情最新消息今天数据网站建设优化
  • 邢台经济开发区网站线上推广平台有哪些
  • 公司网站制作天强科技网站建设知名公司
  • 代码共享网站湖南优化公司
  • isp网站接入做哪些业务深圳优化公司样高粱seo
  • 做网站代码难么免费网络推广
  • asp.net 项目成本预算系统的 网站开发nba最新排行榜
  • 网站建设 客户要退款文案写作软件app
  • wordpress站点赏析巨量引擎广告投放平台官网