当前位置: 首页 > news >正文

神华集团两学一做网站职业技能培训

神华集团两学一做网站,职业技能培训,网站建设的潜在客户,家庭农场做网站1.Spark的特点 Spark的设计遵循“一个软件栈满足不同应用场景”的理念,逐渐形成了一套完整的生态系统,既能够提供内存计算框架,也可以支持SQL即席查询、实时流式计算、机器学习和图计算等。 运行速度快,易使用,强大的技…

1.Spark的特点
Spark的设计遵循“一个软件栈满足不同应用场景”的理念,逐渐形成了一套完整的生态系统,既能够提供内存计算框架,也可以支持SQL即席查询、实时流式计算、机器学习和图计算等。
运行速度快,易使用,强大的技术栈,集成性好
2.Spark与Hive
Hive的缺点
表达能力有限,磁盘IO开销大,延迟高,
3.Spark-streaming与Flink
微批处理,准实时系统
4.Spark的运行架构
Driver向集群管理器申请资源,启动Executor,并向Executor发送程序代码和文件,在Executor上执行任务,执行结果返回任务控制节点或写到HDFS和其他数据库
5.hive on spark和spark on hive
前者只有计算引擎是Spark,前期解析,转换,优化等步骤都是Hive完成。
后者只有元数据用了Hive,对SQL的解析,转换,优化等都是Spark完成。
6.宽窄依赖之间的区别
窄依赖表现为一个父RDD的分区对应于一个子RDD的分区,或多个父RDD的分区对应于一个子RDD的分区
宽依赖则表现为存在一个父RDD的一个分区对应一个子RDD的多个分区
7.RDD运行过程
(1)创建RDD对象;
(2)SparkContext负责计算RDD之间的依赖关系,构建DAG;
(3)DAGScheduler负责把DAG图分解成多个阶段,每个阶段中包含了多个任务,每个任务会被任务调度器分发给各个工作节点(Worker Node)上的Executor去执行。
8.Spark三种部署方式
包括standalone、Spark on Mesos和Spark on YARN
9.广播变量和累加器
Spark中的两个重要抽象是RDD和共享变量
广播变量允许开发人员在每个机器上缓存一个只读的变量,而不是为每个机器的每个任务都生成一个副本
val broadcastVar = sc.broadcast(Array(1, 2, 3))
broadcastVar.value
10.转换算子和行动算子
转换:map,filter,groupByKey,reduceByKey
行动:collect,foreach,count,reduce
键值对:groupByKey,reduceByKey,sortByKey,keys,values,mapValues,join
11.自定义udf和udaf
udf 直接spark.udf.register(“”,函数)
udaf 需继承UserDefinedAggregateFunction 实现父类的8个方法
12.RDD与DataFrame的区别
RDD是分布式的 Java对象的集合
DataFrame是一种以RDD为基础的分布式数据集,也就是分布式的Row对象的集合(每个Row对象代表一行记录)

http://www.dinnco.com/news/54916.html

相关文章:

  • 网站建设模板是什么意思确认已有81人感染
  • 网络工作室能接什么活手机网站搜索优化
  • 建站模板怎么选sem竞价托管多少钱
  • 网站经营性备案多少钱网站首页面设计
  • 手机网站建设万网百度手机助手下载2022新版
  • 中山手机网站建设电话百度搜索引擎优化公司哪家强
  • 网络规划设计师怎么报名seoul是什么意思中文
  • 市政府网站集约化平台建设工作方案seo网络推广技术
  • 建网站 需要签署协议seo哪个软件好
  • 深圳网站设计哪好免费推广方式都有哪些
  • 企业网站开发外包合同香飘飘奶茶软文
  • 如何网站专题制作谷歌广告优化
  • 学校网站建设所使用的技术发帖推广平台
  • 全flash网站模板站长工具平台
  • 外贸免费开发网站建设百度图片搜索入口
  • 用html做企业门户网站网拍外宣怎么推广
  • 新手建网站什么类型好站长统计app网站
  • 深圳网站制作专业公司百度一下百度一下你知道
  • 中国网站建设调查分析江西省seo
  • 世界杯网站建设seo网站诊断方案
  • 详述网站建设的过程深圳网络推广专员
  • 冠县做网站哪里好谷歌官方网站首页
  • 公司网站制作的教程怎么搭建自己的网站
  • 哪个网站做婚礼邀请函好佛山网络公司 乐云seo
  • 做设计在哪个网站上找高清图片大全网络推广文案怎么写
  • 专门做毕业设计的网站如何做一个自己的电商平台
  • 所以免费爱做网站推广普通话的文字内容
  • 廊坊网站制作推广郑州好的seo外包公司
  • 高端品牌网站建设(杭州)正规考证培训机构
  • 服务器可以做网站seo查询系统源码