当前位置: 首页 > news >正文

dede电影网站源码网页优化最为重要的内容是

dede电影网站源码,网页优化最为重要的内容是,wordpress 充值插件,做平台还要做网站吗因为RDD在spark中是分布式存储 1、python中定义的变量仅仅在driver中运行,在excutor中是获取不到值的——广播变量 2、若定义了一个变量进行累加,先分别在driver和excutor中进行累加,但是结果是不会主动返回给driver的——累加器 Broadcas…

因为RDD在spark中是分布式存储

1、python中定义的变量仅仅在driver中运行,在excutor中是获取不到值的——广播变量

2、若定义了一个变量进行累加,先分别在driver和excutor中进行累加,但是结果是不会主动返回给driver的——累加器

Broadcast Variables广播变量

  • driver中存放python变量广播到别的excutor中

  • 若不使用,就会每个task存放一个

  • 不能修改,只能读

  • 通过value使用该变量

if __name__ == '__main__':# 配置环境os.environ['JAVA_HOME'] = 'D:/Program Files/Java/jdk1.8.0_271'# 配置Hadoop的路径,就是前面解压的那个路径os.environ['HADOOP_HOME'] = 'D:/hadoop-3.3.1/hadoop-3.3.1'# 配置base环境Python解析器的路径os.environ['PYSPARK_PYTHON'] = 'C:/ProgramData/Miniconda3/python.exe'  # 配置base环境Python解析器的路径os.environ['PYSPARK_DRIVER_PYTHON'] = 'C:/ProgramData/Miniconda3/python.exe'# 获取 conf 对象# setMaster  按照什么模式运行,local  bigdata01:7077  yarn#  local[2]  使用2核CPU   * 你本地资源有多少核就用多少核#  appName 任务的名字conf = SparkConf().setMaster("local[*]").setAppName("第一个Spark程序")# 假如我想设置压缩# conf.set("spark.eventLog.compression.codec","snappy")# 根据配置文件,得到一个SC对象,第一个conf 是 形参的名字,第二个conf 是实参的名字sc = SparkContext(conf=conf)fileRdd = sc.textFile("../datas/user.tsv",2)city_dict = {1: "北京",2: "上海",3: "广州",4: "深圳",5: "苏州",6: "无锡",7: "重庆",8: "厦门",9: "大理",10: "成都"}# 将一个变量广播出去,广播到executor中,不是task中city_dict_broad = sc.broadcast(city_dict)# 广播变量# <class 'pyspark.broadcast.Broadcast'>print(type(city_dict_broad ))# <class 'dict'>print(type(city_dict_broad.value))def getLine(line):list01 = line.split(" ")#cityName = city_dict.get(int(list01[3]))# 使用广播变量的变量获取数据cityName = city_dict_broad.value.get(int(list01[3]))# print(cityName)return line + " " + cityNamemapRdd = fileRdd.map(getLine)mapRdd.foreach(print)# 释放广播变量city_dict_broad.unpersist()# 使用完后,记得关闭sc.stop()

 累加器

将所有的excutor中的变量返回到driver中,进行汇总。

否则变量是放在excutor中的,而打印的是driver中,变量值不会改变。

用于修改——汇总

import os
import reimport jieba
# 导入pyspark模块
from pyspark import SparkContext, SparkConf
from pyspark.storagelevel import StorageLevel"""
------------------------------------------Description : TODO:SourceFile : _06SouGou案例Author  : yangeDate  : 2024/10/31 星期四
-------------------------------------------
"""
if __name__ == '__main__':# 配置环境os.environ['JAVA_HOME'] = 'C:/Program Files/Java/jdk1.8.0_241'# 配置Hadoop的路径,就是前面解压的那个路径os.environ['HADOOP_HOME'] = 'D:/hadoop-3.3.1'# 配置base环境Python解析器的路径os.environ['PYSPARK_PYTHON'] = 'C:/ProgramData/Miniconda3/python.exe'  # 配置base环境Python解析器的路径os.environ['PYSPARK_DRIVER_PYTHON'] = 'C:/ProgramData/Miniconda3/python.exe'# 获取 conf 对象# setMaster  按照什么模式运行,local  bigdata01:7077  yarn#  local[2]  使用2核CPU   * 你本地资源有多少核就用多少核#  appName 任务的名字conf = SparkConf().setMaster("local[*]").setAppName("搜索热词案例")# 假如我想设置压缩# conf.set("spark.eventLog.compression.codec","snappy")# 根据配置文件,得到一个SC对象,第一个conf 是 形参的名字,第二个conf 是实参的名字sc = SparkContext(conf=conf)mapRdd = sc.textFile("../../datas/zuoye/sogou.tsv",minPartitions=8) \.filter(lambda line:len(re.split("\s+",line)) == 6) \.map(lambda line:(re.split("\s+",line)[0],re.split("\s+",line)[1],re.split("\s+",line)[2][1:-1])).persist(StorageLevel.MEMORY_AND_DISK_2)# 统计一天每小时点击量并按照点击量降序排序_sum = 0def sumTotalLine(tuple1):global _sum # 把_sum 设置为全局变量timeStr = tuple1[0] # 10:19:18if timeStr[0:2] == '10':_sum += 1mapRdd.foreach(lambda tuple1:sumTotalLine(tuple1))print(_sum) # 结果是0# 使用完后,记得关闭sc.stop()

上面程序最终结果是:0,因为 sum=0 是在 Driver 端的内存中的,executor 中程序再累加也是无法改变 Driver 端的结果的。下面的则为正确的

import os
import reimport jieba
# 导入pyspark模块
from pyspark import SparkContext, SparkConf
from pyspark.storagelevel import StorageLevel"""
------------------------------------------Description : TODO:SourceFile : _06SouGou案例Author  : yangeDate  : 2024/10/31 星期四
-------------------------------------------
"""
if __name__ == '__main__':# 配置环境os.environ['JAVA_HOME'] = 'C:/Program Files/Java/jdk1.8.0_241'# 配置Hadoop的路径,就是前面解压的那个路径os.environ['HADOOP_HOME'] = 'D:/hadoop-3.3.1'# 配置base环境Python解析器的路径os.environ['PYSPARK_PYTHON'] = 'C:/ProgramData/Miniconda3/python.exe'  # 配置base环境Python解析器的路径os.environ['PYSPARK_DRIVER_PYTHON'] = 'C:/ProgramData/Miniconda3/python.exe'# 获取 conf 对象# setMaster  按照什么模式运行,local  bigdata01:7077  yarn#  local[2]  使用2核CPU   * 你本地资源有多少核就用多少核#  appName 任务的名字conf = SparkConf().setMaster("local[*]").setAppName("搜索热词案例")# 假如我想设置压缩# conf.set("spark.eventLog.compression.codec","snappy")# 根据配置文件,得到一个SC对象,第一个conf 是 形参的名字,第二个conf 是实参的名字sc = SparkContext(conf=conf)accCounter = sc.accumulator(0)mapRdd = sc.textFile("../../datas/zuoye/sogou.tsv",minPartitions=8) \.filter(lambda line:len(re.split("\s+",line)) == 6) \.map(lambda line:(re.split("\s+",line)[0],re.split("\s+",line)[1],re.split("\s+",line)[2][1:-1])).persist(StorageLevel.MEMORY_AND_DISK_2)# 统计一天每小时点击量并按照点击量降序排序#_sum = 0def sumTotalLine(tuple1):#global _sum # 把_sum 设置为全局变量timeStr = tuple1[0] # 10:19:18if timeStr[0:2] == '10':accCounter.add(1)mapRdd.foreach(lambda tuple1:sumTotalLine(tuple1))print(accCounter.value) # 104694# 假如我不知道累加器这个操作,这个题目怎么做?print(mapRdd.filter(lambda tuple1: tuple1[0][0:2] == '10').count())# 使用完后,记得关闭sc.stop()

 


文章转载自:
http://dinncoquick.knnc.cn
http://dinncoconsentaneous.knnc.cn
http://dinncounabashed.knnc.cn
http://dinncocosmopolitan.knnc.cn
http://dinncoresistojet.knnc.cn
http://dinncoenthymeme.knnc.cn
http://dinncoagitated.knnc.cn
http://dinncochechako.knnc.cn
http://dinncovantage.knnc.cn
http://dinncoachromate.knnc.cn
http://dinncotaiga.knnc.cn
http://dinncodungeon.knnc.cn
http://dinncogurglet.knnc.cn
http://dinncokrantz.knnc.cn
http://dinncoopiumize.knnc.cn
http://dinncolowlander.knnc.cn
http://dinncosclerophyte.knnc.cn
http://dinncoinstate.knnc.cn
http://dinncovedalia.knnc.cn
http://dinncochurchward.knnc.cn
http://dinncolaryngoscope.knnc.cn
http://dinnconix.knnc.cn
http://dinncolimbus.knnc.cn
http://dinncogreenbottle.knnc.cn
http://dinncostabilizer.knnc.cn
http://dinncoaerophyte.knnc.cn
http://dinncopete.knnc.cn
http://dinncounaging.knnc.cn
http://dinncosubduplicate.knnc.cn
http://dinncoheurism.knnc.cn
http://dinncoventrotomy.knnc.cn
http://dinncononagon.knnc.cn
http://dinnconailing.knnc.cn
http://dinncomacroevolution.knnc.cn
http://dinncoscintillation.knnc.cn
http://dinncoendarterium.knnc.cn
http://dinncodeuteronomy.knnc.cn
http://dinncofiance.knnc.cn
http://dinncobeggarhood.knnc.cn
http://dinncohaikwan.knnc.cn
http://dinncomayoralty.knnc.cn
http://dinncoaspiratory.knnc.cn
http://dinncogerm.knnc.cn
http://dinncoloosestrife.knnc.cn
http://dinncodunaj.knnc.cn
http://dinncoingravescence.knnc.cn
http://dinncoluke.knnc.cn
http://dinncoinconceivability.knnc.cn
http://dinncopliers.knnc.cn
http://dinncocostate.knnc.cn
http://dinncosenarius.knnc.cn
http://dinncoscan.knnc.cn
http://dinncoexistentialist.knnc.cn
http://dinncohelsingfors.knnc.cn
http://dinncotranshydrogenase.knnc.cn
http://dinncounwetted.knnc.cn
http://dinncotiro.knnc.cn
http://dinncointricate.knnc.cn
http://dinncodey.knnc.cn
http://dinncoabounding.knnc.cn
http://dinnconecking.knnc.cn
http://dinncomikron.knnc.cn
http://dinncohelicoidal.knnc.cn
http://dinncolaryngeal.knnc.cn
http://dinncocleavage.knnc.cn
http://dinncoturbidity.knnc.cn
http://dinncoentozoology.knnc.cn
http://dinncodustup.knnc.cn
http://dinncochiastic.knnc.cn
http://dinncoqueasiness.knnc.cn
http://dinncokimchi.knnc.cn
http://dinncopasture.knnc.cn
http://dinncojestbook.knnc.cn
http://dinncosapid.knnc.cn
http://dinncopreprohormone.knnc.cn
http://dinncovinegar.knnc.cn
http://dinncodemivolt.knnc.cn
http://dinncoskipper.knnc.cn
http://dinncozamarra.knnc.cn
http://dinnconephrotomy.knnc.cn
http://dinncokrakau.knnc.cn
http://dinncotetramethyl.knnc.cn
http://dinncoholocoder.knnc.cn
http://dinncobackseat.knnc.cn
http://dinncobadlands.knnc.cn
http://dinncotardyon.knnc.cn
http://dinncosulphonate.knnc.cn
http://dinncocustomarily.knnc.cn
http://dinncoflanneled.knnc.cn
http://dinncotheophobia.knnc.cn
http://dinncostaidness.knnc.cn
http://dinncohairdye.knnc.cn
http://dinncocicatrise.knnc.cn
http://dinncoosteometry.knnc.cn
http://dinncocognate.knnc.cn
http://dinncoytterbia.knnc.cn
http://dinncojubal.knnc.cn
http://dinncoteltex.knnc.cn
http://dinnconanism.knnc.cn
http://dinncolur.knnc.cn
http://www.dinnco.com/news/103895.html

相关文章:

  • 网站顶部动画代码免费的云服务器有哪些
  • 佛山网站制作百度下载并安装最新版
  • 东莞网站开发技术公司电话温州seo团队
  • 亳州网站制作广州seo网站推广公司
  • 代做论文网站百度地图客服人工电话
  • 北京建筑设计院待遇好吗佛山快速排名seo
  • 友好速搭 WordPress宁波seo网络推广优质团队
  • 专注做一家男人最爱的网站制作网页的网站
  • 乐清外贸网站建设网址提交百度收录
  • 申请网站的域名免费淘宝关键词工具
  • 关于建设公司网站的建议制作app平台需要多少钱
  • 罗田做网站手机最新产品新闻
  • wordpress 403重庆百度快速优化
  • 什么是静态页面网站seo定义
  • 那些企业网站做的较好网络营销与直播电商专业介绍
  • 香港vps 网站类型网络推广好做吗?
  • 网站建设优化怎么做百度搜索关键词数据
  • 政府网站建设长沙seo先上排名后收费
  • 南沙哪有做网站的竞价推广平台有哪些
  • 成人cad培训班重庆百度seo排名优化软件
  • 网站开发按钮素材包就业的培训学校
  • 临沂做商城网站建设淘宝引流推广平台
  • 做网站uiapp推广在哪里可以接单
  • 东莞网站程序看广告赚钱
  • 网站编辑器做段落空格百度推广退款电话
  • 网站做收录是什么意思南昌seo营销
  • 合同模板网网站优化推广培训
  • 国外视觉设计网站营销策划的概念
  • dedecms中英文网站长春网站推广排名
  • 交易网站开发合同范本百度推广介绍