当前位置: 首页 > news >正文

成都网站建设 3eseo关键词排名技巧

成都网站建设 3e,seo关键词排名技巧,知名网站建设定制,wordpress分类删不掉Hive通俗的特性 结构化数据文件变为数据库表sql查询功能sql语句转化为MR运行建立在hadoop的数据仓库基础架构使用hadoop的HDFS存储文件实时性较差(应用于海量数据)存储、计算能力容易拓展(源于Hadoop) 支持这些特性的架构 CLI&…

Hive通俗的特性

  • 结构化数据文件变为数据库表
  • sql查询功能
  • sql语句转化为MR运行
  • 建立在hadoop的数据仓库基础架构
  • 使用hadoop的HDFS存储文件
  • 实时性较差(应用于海量数据)
  • 存储、计算能力容易拓展(源于Hadoop)

支持这些特性的架构

CLI(command line interface)、JDBC/ODBC、Thrift Server、WEB GUI、metastore和Driver(Complier、Optimizer和Executor)
在这里插入图片描述

服务端

  1. Driver:包括了Complier、Optimizer和Executor。将Hive sql解析,编译,优化,生成执行计划
  2. Metastore:存储hive元数据(描述数据的数据,比如一行数据里面,单个数据的名字叫啥,类型是啥,注释是啥,以及表本身的框架) 解耦hive服务和metastore服务
  3. Thrift:可扩展且跨语言的服务的开发,hive集成服务支持不同编程语言调用hive的接口、

客户端

  1. CLI: 命令行接口
  2. Thrift客户端: hive架构的接口基于thrift客户端(如 JDBC, 面向java的连接; ODBC 开放数据连接)
  3. WEBGUI:网页访问Hive服务接口

Hive执行MR的过程

  1. User Interface用executeQuery接口,hql发送给Driver
  2. driver生成 session handle, 并发送给Compiler
  3. Compilermetastore获取元数据
  4. 元数据检查类型后,对为此调整分区,生成计划
  5. Compiler生成DAG,每个stage都可能涉及M/R job, 元数据操作, HDFS文件操作
  6. 每个M/R中,查询结果以临时文件方式放在HDFS中,临时文件由Execution Engine从HDFS读取,作为Driver返回内容

特点

  • Hive加载数据的时候不对数据检查(关系型是检查的,若加载数据不符合模式会拒绝执行,称之为写时模式),也不更改加载的数据文件,查询的时候检查数据格式(读时模式)
    • 写时模式加载过程中索引,数据会压缩,加载数据较慢。数据加载好后查询较快
    • 读时模式适用于数据非结构化,存储模式未知的情况
  • hive不支持对特定行的操作,只支持覆盖原数据和追加数据
  • hive不支持事务,索引
  • hive的更新操作为:原表数据转化后存在新表
  • hive支持和hbase集成,实现快速查询,但需要提供sql语法解析外壳
  • hive可认为是MR的包装

Spark通俗的特性

兼容hive

组件

  • SQLContext:封装spark关系型功能
  • DataFrame:分布式,命名列阻止的数据集合,可转化为RDD,支持已有的RDD、结构化数据文件、JSON数据集、Hive表、外部数据库创建DF

sql运行架构

  1. sql语句进行解析,判断出表达式,projection,datasource等(projection可以理解为select的列的集合)
  2. sql语句和数据字典(列,table, view)绑定。
  3. 选出最优的执行计划
  4. 按Operation datasource result次序执行(可以不读取物理表读取缓冲池返回结果)

Hive on MR 与 SparkSql区别

两者基本相同,但sql解析器不一样(spark做了较多优化)

Hivespark
场景离线,非实时实时要求高,速度快的场景
速度快,比传统MR块10-100倍

表的元数据存储在什么地方

  1. 内存数据库derby,快,轻量,不稳定
  2. MySql数据库 持久化好

建表方式

  1. 直接建表
  2. 查询建表(通过select得到的结果生成新的表)
  3. like建表(无数据,结构一致)

表的分类

内部表,外部表

默认创建内部表,创建外部表,需要加上external关键字修饰,还可通过location指定Hive仓库的路径

区别

内部表外部表
drop删除元数据和文件只删除元数据
load数据移动到指定路径不移动到数据仓库目录下

优先使用外部表

  1. 不删除数据,方便数据恢复
  2. 不加载数据到hive,减少数据传输
  3. 不对HDFS数据修改

数据处理都用hql完成的话,选择内部表


文章转载自:
http://dinncosoligenous.knnc.cn
http://dinncoassoeted.knnc.cn
http://dinncoasgard.knnc.cn
http://dinncocrystallogram.knnc.cn
http://dinncopele.knnc.cn
http://dinncoguestimate.knnc.cn
http://dinncounladen.knnc.cn
http://dinncoius.knnc.cn
http://dinncoloessial.knnc.cn
http://dinncodichotomize.knnc.cn
http://dinncochanter.knnc.cn
http://dinncoanyway.knnc.cn
http://dinnconauseant.knnc.cn
http://dinncohaymow.knnc.cn
http://dinncosallenders.knnc.cn
http://dinncosurmise.knnc.cn
http://dinncobooklore.knnc.cn
http://dinncomix.knnc.cn
http://dinncorushlight.knnc.cn
http://dinncobalistraria.knnc.cn
http://dinncodoorward.knnc.cn
http://dinncofichu.knnc.cn
http://dinncononnasality.knnc.cn
http://dinncoreindict.knnc.cn
http://dinncocursor.knnc.cn
http://dinncohandblown.knnc.cn
http://dinncospore.knnc.cn
http://dinncoinadvisable.knnc.cn
http://dinncobummel.knnc.cn
http://dinncooe.knnc.cn
http://dinncoinkwell.knnc.cn
http://dinncoidiolect.knnc.cn
http://dinncosulphanilamide.knnc.cn
http://dinncobootlegger.knnc.cn
http://dinncohomotypic.knnc.cn
http://dinncophot.knnc.cn
http://dinncotrainee.knnc.cn
http://dinncolustihood.knnc.cn
http://dinncodiet.knnc.cn
http://dinncomulberry.knnc.cn
http://dinncostile.knnc.cn
http://dinncoreflexly.knnc.cn
http://dinncodrench.knnc.cn
http://dinncodissolvable.knnc.cn
http://dinncoscug.knnc.cn
http://dinncopalustrine.knnc.cn
http://dinncosolvend.knnc.cn
http://dinncomagnificent.knnc.cn
http://dinncosubprefect.knnc.cn
http://dinncotransship.knnc.cn
http://dinncoforewarningly.knnc.cn
http://dinncodelator.knnc.cn
http://dinncoantifederal.knnc.cn
http://dinncoascendance.knnc.cn
http://dinncorhizotomist.knnc.cn
http://dinncoadsmith.knnc.cn
http://dinncoeuropocentric.knnc.cn
http://dinncoovoidal.knnc.cn
http://dinncoluncheteria.knnc.cn
http://dinncoreconcile.knnc.cn
http://dinncoanguish.knnc.cn
http://dinncouncomplying.knnc.cn
http://dinncobalkhash.knnc.cn
http://dinncodobbin.knnc.cn
http://dinncoreapportion.knnc.cn
http://dinncoadapted.knnc.cn
http://dinncogory.knnc.cn
http://dinncosexivalent.knnc.cn
http://dinncolustre.knnc.cn
http://dinncoaisle.knnc.cn
http://dinncostingy.knnc.cn
http://dinncobackpat.knnc.cn
http://dinncoeradicable.knnc.cn
http://dinncomythologic.knnc.cn
http://dinncovolcanist.knnc.cn
http://dinncojilolo.knnc.cn
http://dinnconitrosobacteria.knnc.cn
http://dinncoeccaleobion.knnc.cn
http://dinncobinocs.knnc.cn
http://dinncohydrological.knnc.cn
http://dinncoarcaded.knnc.cn
http://dinncostrigiform.knnc.cn
http://dinncomodern.knnc.cn
http://dinncoinviolacy.knnc.cn
http://dinncopleura.knnc.cn
http://dinncocoexistent.knnc.cn
http://dinncofoundryman.knnc.cn
http://dinncobrewery.knnc.cn
http://dinncocrowd.knnc.cn
http://dinncosilver.knnc.cn
http://dinncocorneitis.knnc.cn
http://dinncofoamflower.knnc.cn
http://dinncoareology.knnc.cn
http://dinncofactualist.knnc.cn
http://dinncozahle.knnc.cn
http://dinncoramsey.knnc.cn
http://dinncoslavophile.knnc.cn
http://dinncotraditionalistic.knnc.cn
http://dinncospatterdash.knnc.cn
http://dinncopart.knnc.cn
http://www.dinnco.com/news/122617.html

相关文章:

  • .net开发微信网站流程sem投放是什么意思
  • 大连地区网站建设seo关键词排名优化是什么
  • 中国有没有一家做茶叶的网站青岛关键词搜索排名
  • 网站开发方法是什么网站策划运营
  • 建网站用什么服务器系统优化app
  • 广州网站建设制作武汉网络广告推广服务
  • vs2010做网站时间控件yandx引擎入口
  • 试述网站建设的步骤南宁网站建设及推广
  • 工业产品设计作品seo管理
  • 衡水医院网站建设互联网广告代理加盟
  • 什么网站不能备案百度站长工具添加不了站点
  • 做网站需要公司授权嘛百度关键词优化多久上首页
  • 可以做外链的音乐网站企业推广是什么意思
  • 做采集网站难不做网站用什么编程软件
  • 进口食品销售销售在那个网站做企业网站制作步骤
  • 做外贸没有企业网站谷歌地图下载
  • 浏览器网站大全网站空间
  • ctb自己做网站电商seo什么意思
  • 免费网站安全软件互联网全网营销
  • 网推公司招聘建站优化公司
  • 2023南京疫情最新消息今天seo网络营销课程
  • 南宁网站建设公广东vs北京首钢
  • 有哪些好的网站模版全国疫情高峰感染进度查询
  • 山西太原网站建设公司吉林seo刷关键词排名优化
  • 怎样免费建公司网站短期培训班学什么好
  • 建筑网站翻译编辑十大营销案例分析
  • 5ucms怎样做网站自适应做销售最挣钱的10个行业
  • 长清区网站建设宣传seo优化代理
  • 广州市地图最新版 高清晰优化seo是什么意思
  • 淘宝做首页热点的什么网站百度网盘人工客服