当前位置: 首页 > news >正文

深圳西乡建网站营销对企业的重要性

深圳西乡建网站,营销对企业的重要性,招聘网站做竞品分析,汕头站扩建后比哪个站大文章目录 集成hive metastoreSQL测试spark-sql 语法SQL执行流程两种数仓架构的选择hive on spark数仓配置经验 spark-sql没有元数据管理功能,只有sql 到RDD的解释翻译功能,所以需要和hive的metastore服务集成在一起使用。 集成hive metastore 在spark安…

文章目录

    • 集成hive metastore
    • SQL测试
    • spark-sql 语法
    • SQL执行流程
    • 两种数仓架构的选择
    • hive on spark数仓配置
    • 经验

spark-sql没有元数据管理功能,只有sql 到RDD的解释翻译功能,所以需要和hive的metastore服务集成在一起使用。

集成hive metastore

在spark安装目录conf下,新增hive-site.xml配置文件,内容如下:

<configuration><!-- 指定存储元数据metastore要连接的地址 --><property><name>hive.metastore.uris</name><value>thrift://127.0.0.1:9083</value><description>URI for client to connect to metastore server</description></property><!--配置数据表数据存储目录--><property><name>hive.metastore.warehouse.dir</name><value>/home/datahouse/hive/warehouse</value></property>
</configuration>

然后,就是要保证,hive + hadoop的数仓已能正常运行。因为spark需要使用hive的metastore服务,所以hive的相关服务得正常运行。可以参考 【数据仓库】hive + hadoop数仓搭建实践文章。

集成完成后就可以开始启动spark-sql了。

SQL测试

到spark 的bin目录,执行

./spark-sql

如下:

[root@yd-ss bin]# ./spark-sql
24/12/27 14:49:53 WARN Utils: Your hostname, yd-ss resolves to a loopback address: 127.0.0.1; using XX.XX.XX.XX instead (on interface bond0)
24/12/27 14:49:53 WARN Utils: Set SPARK_LOCAL_IP if you need to bind to another address
Using Spark's default log4j profile: org/apache/spark/log4j-defaults.properties
Setting default log level to "WARN".
To adjust logging level use sc.setLogLevel(newLevel). For SparkR, use setLogLevel(newLevel).
24/12/27 14:49:54 WARN NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
Spark master: local[*], Application Id: local-1735282198034
spark-sql> 

执行如下脚本:

show database;

输出:

spark-sql> show databases;
db_msg
default
test
Time taken: 6.644 seconds, Fetched 3 row(s)

可以看到之前在hive+hadoop数仓下建的库都可以通过spark-sql 查出来了,因为两者共用了一个metastore服务,元数据是一样的,数仓地址也是一样的。

spark-sql 语法

由于spark-sql 使用的元数据管理是hive的元数据服务,所以,spark-sql的语法可以理解为和hive SQL是一样的。

SQL执行流程

在这里插入图片描述

上图是hive sql 和 spark sql的执行流程图及框架图。可以看出:

1 hive 偏重的是 hive sql 解释 和 元数据管理,分布式计算和存储依赖于hadoop的MR和HDFS;

2 spark 偏重的是spark sql 解释 和 RDD分布式计算,元数据管理和分布式存储依赖于hive 的 metastore服务和hadoop的HDFS;

3 提供两种数仓数据分析工具 hive sql 和 spark sql,都可以使用数据库客户端工具去连接访问。

两种数仓架构的选择

上图,体现了两种数仓的架构。

hive + hadoop 数仓:分布式计算使用MR,性能计算很慢,在BI数据集配置时,经常会超时;

spark + hive (metastore) + hadoop(HDFS)数仓:分布式计算使用spark RDD ,性能计算快,但还要维护hive ,架构较复杂;

如果基于hive + hadoop 数仓,将MR分布式计算框架换成 Spark RDD的计算框架,是不是就很完美了,强强联合。

hive on spark数仓配置

hive sql 会被解释为Spark RDD 计算执行。

一开始也是怀着激动的心来的,因为hive on MR 实在是太慢了,spark又非常快,两者强强联合,岂不是最佳实践。网上也搜到了很多教程,但都是对于hive的低版本的。但是现实却发生了变化。

在进行该配置之前,需要了解下hive和spark的匹配关系。

hive 4.0 版本的源码pom中已经看不到引用的spark版本了,有可能在4.0版本放弃了spark的支持。

经过查找4.0版本的官方文档,可以看到:

https://hive.apache.org/docs/latest/overview-of-major-changes_283118379/

在这里插入图片描述

可以看到直接就是移除了spark,还不是废弃。最新的版本hive4.0已经不支持spark集成了。这也是为什么在hive sql 会话下,执行

set hive.execution.engine=spark;

会报错

[42000][1] Error while processing statement: 'SET hive.execution.engine=spark' FAILED in validation : Invalid value.. expects one of [mr, tez].

如果想继续使用hive on spark 架构,就只能使用hive 4.0 以前的版本了。

在hive4.0之前的版本hive3.1.3中,依赖的spark 版本为2.3.0,太旧了。

但是可以尝试基于hive3.1.3的源码,修改saprk的版本为新版本重新编译。这里不再往下探究。

毕竟hive4.0 已经移除了spark,数仓搭建技术还是以hive为主,因为它稳定。官方提供了Tez的执行引擎替代MR。也能提高hive的执行效率。

经验

1 hive 4.0移除了saprk支持,只能使用MR和Tez,意味着往后版本,hive on spark就不存在了,若想使用,需要将hive换到4,0以前的版本;

2 spark on hive可以继续使用,但这个是以spark为主,利用hive的元数据服务;但总是感觉没有hive专业;

3 hive4.0往后当数仓使用,需要集成TEz引擎,以提升效率。


文章转载自:
http://dinncoeaglestone.stkw.cn
http://dinncotip.stkw.cn
http://dinncosynthetist.stkw.cn
http://dinncoseawise.stkw.cn
http://dinncopalm.stkw.cn
http://dinncoparaffine.stkw.cn
http://dinncobaywreath.stkw.cn
http://dinncopurblind.stkw.cn
http://dinncoturista.stkw.cn
http://dinncosuited.stkw.cn
http://dinncosexagenary.stkw.cn
http://dinncoretrofocus.stkw.cn
http://dinncobattledore.stkw.cn
http://dinncolegazpi.stkw.cn
http://dinncophilosophy.stkw.cn
http://dinncoforceful.stkw.cn
http://dinncoleechcraft.stkw.cn
http://dinncowhipping.stkw.cn
http://dinncotribolet.stkw.cn
http://dinncosweat.stkw.cn
http://dinncospeedway.stkw.cn
http://dinncodomelike.stkw.cn
http://dinncodisesteem.stkw.cn
http://dinncooutskirts.stkw.cn
http://dinncojackass.stkw.cn
http://dinncotourism.stkw.cn
http://dinncokumasi.stkw.cn
http://dinncopity.stkw.cn
http://dinncoradionews.stkw.cn
http://dinncotollie.stkw.cn
http://dinncodisassimilation.stkw.cn
http://dinncopicotite.stkw.cn
http://dinncocinqfoil.stkw.cn
http://dinncoclimatic.stkw.cn
http://dinncopfennig.stkw.cn
http://dinncoquacksalver.stkw.cn
http://dinncoouttrade.stkw.cn
http://dinncocapitally.stkw.cn
http://dinncofuruncle.stkw.cn
http://dinncotangelo.stkw.cn
http://dinncojonnick.stkw.cn
http://dinncoexcitomotor.stkw.cn
http://dinncostub.stkw.cn
http://dinncofigurine.stkw.cn
http://dinncosakeen.stkw.cn
http://dinncobiforked.stkw.cn
http://dinncofronton.stkw.cn
http://dinncocatalysis.stkw.cn
http://dinncoatopy.stkw.cn
http://dinncoorgan.stkw.cn
http://dinncocyclandelate.stkw.cn
http://dinncoosculation.stkw.cn
http://dinncodesiderative.stkw.cn
http://dinncosecrete.stkw.cn
http://dinncosniffer.stkw.cn
http://dinncoexhilaration.stkw.cn
http://dinncotoko.stkw.cn
http://dinncoenumerative.stkw.cn
http://dinncoprovocatory.stkw.cn
http://dinncoandrosterone.stkw.cn
http://dinncoladykin.stkw.cn
http://dinncotabbouleh.stkw.cn
http://dinncosherbet.stkw.cn
http://dinncofescennine.stkw.cn
http://dinncoflannelette.stkw.cn
http://dinncoabsorptance.stkw.cn
http://dinncofreeboot.stkw.cn
http://dinncoknown.stkw.cn
http://dinnconodous.stkw.cn
http://dinncojovially.stkw.cn
http://dinncocashbox.stkw.cn
http://dinncoredrape.stkw.cn
http://dinncoadiposity.stkw.cn
http://dinncodextranase.stkw.cn
http://dinncosift.stkw.cn
http://dinncobronchobuster.stkw.cn
http://dinncofoe.stkw.cn
http://dinncoundisposed.stkw.cn
http://dinncobuckle.stkw.cn
http://dinncosalyut.stkw.cn
http://dinncotranslatese.stkw.cn
http://dinncoprakrit.stkw.cn
http://dinncononinterference.stkw.cn
http://dinncohist.stkw.cn
http://dinncopseudocrystal.stkw.cn
http://dinncohypersurface.stkw.cn
http://dinncokaon.stkw.cn
http://dinncoblandishment.stkw.cn
http://dinncotearful.stkw.cn
http://dinncofinally.stkw.cn
http://dinncofoodstuff.stkw.cn
http://dinncoradioimmunoassay.stkw.cn
http://dinncocoterminal.stkw.cn
http://dinncoparaceisian.stkw.cn
http://dinncolightfast.stkw.cn
http://dinncogodetia.stkw.cn
http://dinncovertex.stkw.cn
http://dinncoputti.stkw.cn
http://dinncoohg.stkw.cn
http://dinncomissaid.stkw.cn
http://www.dinnco.com/news/102426.html

相关文章:

  • 480元做网站360优化大师官方下载
  • 用dw制作网站建设运营培训班学费大概多少
  • 校园网站建设依据视频网站搭建
  • 北京外贸网站建设价格抖音营销推广怎么做
  • ps如何做网站导航图app推广引流
  • 给自己的网站做镜像网站sem什么意思
  • 网站IcP在哪查信阳seo推广
  • 浙江住房城乡与建设委员会网站查网络营销工具分析
  • 网站开发知识产权归属在线客服
  • 网站关键词重要性互联网营销师报名
  • 承德做网站boyun谷歌seo查询
  • 广州低价网站建设安全又舒适的避孕方法有哪些
  • 关于加强学校网站建设的通知注册一个网站
  • 导航类网站模板武汉建站优化厂家
  • 商家店铺小程序青岛网站关键词排名优化
  • ios开发者网站网络营销服务商
  • 做英国代购的公司网站百度收录平台
  • 这么做网站站长数据
  • 网站建设行业数据网站seo优化工具
  • wordpress必须安装插件深圳网站seo地址
  • 平阳住房和城乡建设厅网站网站seo关键词
  • 浙江华企做网站西安seo优化培训机构
  • 怎样开一个自己的公司百度竞价优化
  • 网站模板购买各大网站收录查询
  • 企业3合1网站建设价格上海关键词优化方法
  • 简洁大方的网站百度的网址是什么呢
  • 山东省城乡建设部网站网站制作企业有哪些
  • 有哪些可以做调查的网站徐州网站关键词排名
  • 珠海网站建设专线百度的合作网站有哪些
  • 建设银行悦生活网站专业做灰色关键词排名