当前位置: 首页 > news >正文

昆明网站建设价目表网站搭建步骤

昆明网站建设价目表,网站搭建步骤,徐州方案公示在哪个网站,怎样做一个免费的网站spark的代码分为两种 本地代码在driver端直接解析执行没有后续 集群代码,会在driver端进行解析,然后让多个机器进行集群形式的执行计算 spark-shell --master spark://nn1:7077 --executor-cores 2 --executor-memory 2G sc.textFile("/home/ha…

spark的代码分为两种

  • 本地代码在driver端直接解析执行没有后续

  • 集群代码,会在driver端进行解析,然后让多个机器进行集群形式的执行计算

spark-shell --master spark://nn1:7077 --executor-cores 2 --executor-memory 2G
sc.textFile("/home/hadoop/a.txt")
org.apache.spark.rdd.RDD[String] = /home/hadoop/a.txt MapPartitionsRDD[1] at textFile at

rdd弹性分布式数据集合

  • 如果是sc调用的方法会在集群中执行
  • rdd调用的方法也会集群执行
sc.textFile("/home/hadoop/a.txt")

不是单机代码,但是文件不能再某一个机器上,因为这个命令所有的机器都会执行。

这个路径一定要放在hdfs中

问题:第一行代码就读取了数据,为什么第一行没有出现错误?

spark中的方法[算子]它是分为两种

  • 转换类算子,定义逻辑,并且调用完毕以后具有返回值的,调用算子以后是不是返回rdd
  • 行动类算子,触发计算,并且没有rdd的返回

代码的整体逻辑是先使用转换类算子定义逻辑,但是不执行,一旦使用action算子就会触发运算,整体才执行,这样的设计能够最大化的减少内存的使用。

所以上传hdfs文件,读取

hdfs dfs -put /home/hadoop/a.txt /

spark-shell整体代码

scala> //在spark-env.sh中配置HADOOP_CONF_DIR,默认会读取hdfs中的文件scala> sc.textFile("/a.txt")
res6: org.apache.spark.rdd.RDD[String] = /a.txt MapPartitionsRDD[5] at textFile at <console>:26
//放入数据到hdfs中
scala> res6.flatMap(_.split(" "))
res7: org.apache.spark.rdd.RDD[String] = MapPartitionsRDD[6] at flatMap at <console>:27scala> res7.map((_,1))
res8: org.apache.spark.rdd.RDD[(String, Int)] = MapPartitionsRDD[7] at map at <console>:27scala> res8.groupBy(_._1)
res9: org.apache.spark.rdd.RDD[(String, Iterable[(String, Int)])] = ShuffledRDD[9] at groupBy at <console>:27
//分组完毕的返回值不再是map而是RDD[String,Iterable]
scala> res9.mapValues(_.size)
res10: org.apache.spark.rdd.RDD[(String, Int)] = MapPartitionsRDD[10] at mapValues at <console>:27
//mapValues在scala中只能作用在map集合上,现在可以作用在RDD[k,v]
scala> res10.foreach(println)
//打印数据的时候每个机器都有,因为是分布式执行的

http://www.dinnco.com/news/47526.html

相关文章:

  • 北京国互网网站建设价格seo整站优化更能准确获得客户
  • 网站建设与行政管理谷歌seo网站运营
  • 网站建设修改建议书各引擎收录查询
  • 网站关键词多少个好全网最全搜索引擎app
  • 简速做网站工作室什么是淘宝seo
  • 网站的布局有哪些谷歌搜索引擎香港免费入口
  • 廊坊哪里有做网站的网站页面的优化
  • 投资公司靠什么赚钱的百度网站优化公司
  • 开服网站源码seo主要做哪些工作
  • ps做图 游戏下载网站徐州seo外包公司
  • 网站建设有关图片百度热搜大数据
  • 网站建设或网站优化排名怎样在百度上宣传自己的产品
  • 怎么做微网站推广专业seo公司
  • 南宁做网站推广的公司山西seo排名
  • 成都网站建设138seo关键词布局
  • 学校部门网站建设总结上海最新疫情
  • 佛山专业的做网站的网页模板建站系统
  • 宝塔做网站公司网站模板
  • 网站设计岗位做哪些事情大连网络营销seo
  • 网站建设可用性的五个方面门户网站推广方案
  • 金昌大型网站建设费用真实有效的优化排名
  • google网站建设网站查询工具seo
  • 易语言做电影网站源码三门峡网站seo
  • 网站布局介绍冯耀宗seo博客
  • 淮南网站推广什么叫优化关键词
  • 网站设计简单吗网站快速上排名方法
  • 电子商务网站开发 微盘下载青岛seo经理
  • 晋江企业网站制作公司官网怎么做
  • 杭州网站建设公司哪家好aso优化推广公司
  • 献县制作网站搜索引擎优化搜索优化