当前位置: 首页 > news >正文

全省建设信息网站怎么看关键词的搜索量

全省建设信息网站,怎么看关键词的搜索量,做营销网站企业,公司网站招聘费如何做会计分录一、目的 当Hive的计算引擎是spark或mr时,发现海豚调度HQL任务的脚本并不同,mr更简洁 二、Hive的计算引擎是Spark时 (一)海豚调度脚本 #! /bin/bash source /etc/profile nowdatedate --date0 days ago "%Y%m%d" y…

一、目的

当Hive的计算引擎是spark或mr时,发现海豚调度HQL任务的脚本并不同,mr更简洁

二、Hive的计算引擎是Spark时

(一)海豚调度脚本

#! /bin/bash
source /etc/profile

nowdate=`date --date='0 days ago' "+%Y%m%d"`
yesdate=`date -d yesterday +%Y-%m-%d`

hive -e "
use hurys_dc_dwd;

set hive.vectorized.execution.enabled=false;
set hive.auto.convert.join=false;
set mapreduce.map.memory.mb=10150;
set mapreduce.map.java.opts=-Xmx6144m;
set mapreduce.reduce.memory.mb=10150;
set mapreduce.reduce.java.opts=-Xmx8120m;
set hive.exec.dynamic.partition.mode=nonstrict;
set hive.exec.dynamic.partition=true;
set hive.exec.parallel=true;
set hive.support.concurrency=false;
set mapreduce.map.memory.mb=4128;
set hive.vectorized.execution.enabled=false;

set hive.exec.dynamic.partition=true;
set hive.exec.dynamic.partition.mode=nonstrict;
set hive.exec.max.dynamic.partitions.pernode=1000;
set hive.exec.max.dynamic.partitions=1500;

insert  overwrite  table dwd_evaluation partition(day='$yesdate')
select device_no,
       cycle,
       lane_num,
       create_time,
       lane_no,
       volume,
       queue_len_max,
       sample_num,
       stop_avg,
       delay_avg,
       stop_rate,
       travel_dist,
       travel_time_avg
from hurys_dc_ods.ods_evaluation
where volume is not null  and   date(create_time)= '$yesdate'
group by device_no, cycle, lane_num, create_time, lane_no,
         volume, queue_len_max, sample_num, stop_avg, delay_avg, stop_rate, travel_dist, travel_time_avg
"

(二)任务流执行结果

调度执行成功,时间需要1m29s

三、Hive的计算引擎是MR时

(一)海豚调度脚本

#! /bin/bash
source /etc/profile

nowdate=`date --date='0 days ago' "+%Y%m%d"`
yesdate=`date -d yesterday +%Y-%m-%d`

hive -e "
use hurys_dc_dwd;

set hive.exec.dynamic.partition=true;
set hive.exec.dynamic.partition.mode=nonstrict;
set hive.exec.max.dynamic.partitions.pernode=1000;
set hive.exec.max.dynamic.partitions=1500;

insert  overwrite  table dwd_evaluation partition(day='$yesdate')
select device_no,
       cycle,
       lane_num,
       create_time,
       lane_no,
       volume,
       queue_len_max,
       sample_num,
       stop_avg,
       delay_avg,
       stop_rate,
       travel_dist,
       travel_time_avg
from hurys_dc_ods.ods_evaluation
where volume is not null  and   date(create_time)= '$yesdate'
group by device_no, cycle, lane_num, create_time, lane_no,
         volume, queue_len_max, sample_num, stop_avg, delay_avg, stop_rate, travel_dist, travel_time_avg
"

(二)任务流执行结果

调度执行成功,时间需要1m3s

四、脚本区别

计算引擎为spark时,脚本比计算引擎为mr多,而且spark运行速度比mr慢

set hive.vectorized.execution.enabled=false;
set hive.auto.convert.join=false;
set mapreduce.map.memory.mb=10150;
set mapreduce.map.java.opts=-Xmx6144m;
set mapreduce.reduce.memory.mb=10150;
set mapreduce.reduce.java.opts=-Xmx8120m;
set hive.exec.dynamic.partition.mode=nonstrict;
set hive.exec.dynamic.partition=true;
set hive.exec.parallel=true;
set hive.support.concurrency=false;
set mapreduce.map.memory.mb=4128;
set hive.vectorized.execution.enabled=false;

mr为计算引擎时任务流脚本不能添加上面这些优化语句,不然会报错

在海豚调度HiveSQL任务流,推荐使用mr作为Hive的计算引擎。

不仅不需要安装spark,而且脚本简洁、任务执行速度快!

http://www.dinnco.com/news/9853.html

相关文章:

  • 四川专业旅游网站制作今日国际新闻头条15条
  • 网页定制多少钱seo高级优化技巧
  • 在网上做黑彩网站会怎样客户资源买卖平台
  • 做网站一条龙搜索引擎推广有哪些
  • 北京平台网站建设公司百度排名点击软件
  • 商标设计平台什么是seo和sem
  • 宁波网站设计微信推广引流平台
  • 网站建设 广州佛山百度搜索风云榜手机版
  • 简述常见的软件开发模型免费seo营销软件
  • 网站源码大全免费的国外推广渠道平台
  • 百度爱采购官方网站凡科建站和华为云哪个好
  • 东营做网站seo品牌建设
  • 怎么做病毒视频网站电销名单渠道在哪里找
  • 网站开发工程师的要求近三天发生的重要新闻
  • php装饰公司网站源码安徽seo推广
  • 张家港外贸型网站建设百度手机端排名如何优化
  • web网站开发部署天琥设计培训学校官网
  • 中国建设银行招聘官方网站广州seo推广
  • 做薪酬调查有哪些网站寻找客户的渠道和方法
  • 合肥网站设计哪家公司好凡科网站建设
  • 自己做的网站打开空白百度链接提交
  • 个人可以做外贸网站吗百度一下下载
  • 山东嘉祥做网站的有哪几家河北百度seo点击软件
  • wordpress做新闻网站的主题上海企业网站seo
  • 郑州做公司网站的提供seo服务
  • 青岛专业做网站的全媒体运营师培训
  • 建站网站图片不显示1小时快速搭建网站
  • 上海做外贸网站的公司深圳市seo上词多少钱
  • 表白网页在线生成制作免费揭阳百度seo公司
  • 哪里找做网站的客户产品推广步骤