当前位置: 首页 > news >正文

山东滨州有多少网站开发公司网站很卡如何优化

山东滨州有多少网站开发公司,网站很卡如何优化,上海哪里有做网站的,网站建设超链接制作PySpark的编程,主要氛围三大步骤:1)数据输入、2)数据处理计算、3)数据输出 1)数据输入:通过SparkContext对象,晚上数据输入 2)数据处理计算:输入数据后得到RDD对象,对RDD…

PySpark的编程,主要氛围三大步骤:1)数据输入、2)数据处理计算、3)数据输出
1)数据输入:通过SparkContext对象,晚上数据输入
2)数据处理计算:输入数据后得到RDD对象,对RDD对象进行迭代计算
3)数据输出:最终通过RDD对象的成员方法,完成数据输出工作

安装pyspark

pip install pyspark
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pyspark   # 清华大学镜像

想要使用PySpark库完成数据处理,首先需要构建一个执行环境入口对象 PySpark的执行环境入口对象是:类SparkContext的类对象

构建PySpark执行环境入口对象:

# 导包
from pyspark import SparkConf, SparkContext# 创建SparkConf类对象
conf = SparkConf().setMaster("local[*]").setAppName("test_spark_app")  # 链式调用的写法# 基于SparkConf类对象创建parkContext类对象
sc = SparkContext(conf=conf)# 打印PySpark的允许版本
print(sc.version)# 停止SparkContext对象的运行(停止PySpark程序)
sc.stop()

RDD: 弹性分布式数据集

1. python数据容器 转RDD对象
通过SpaarkContext对象的parallelize成员方法,将python数据容器转换为PySpark的RDD对象
2. 读取文件数据 转RDD对象
通过SpaarkContext入口对象textFile()方法,来读取文件,来构建出RDD对象

通过PySpark代码加载数据,即数据输入:

from pyspark import SparkConf, SparkContextconf = SparkConf().setMaster("local[*]").setAppName("test_spark")
sc = SparkContext(conf=conf)# 通过parallelize方法将python数据容器加载到spark内,成为RDD对象
rdd1 = sc.parallelize([1, 2, 3, 4, 5])
rdd2 = sc.parallelize((1, 2, 3, 4, 5))
rdd3 = sc.parallelize("abcdefg")
rdd4 = sc.parallelize({1, 2, 3, 4, 5})
rdd5 = sc.parallelize({"key1": "value1", "key2": "value"})# 如果要查看RDD里面有什么内容,需要用collect()方法
print(rdd1.collect())  # [1, 2, 3, 4, 5]
print(rdd2.collect())  # [1, 2, 3, 4, 5]
print(rdd3.collect())  # ['a', 'b', 'c', 'd', 'e', 'f', 'g']
print(rdd4.collect())  # [1, 2, 3, 4, 5]
print(rdd5.collect())  # ['key1', 'key2']# 通过textFile方法,读取文件数据加载到spark内,成为RDD对象
rdd6 = sc.textFile("./test.txt")
print(rdd6.collect())  # ['123456', '123456', '123456']sc.stop()

数据计算:

PySpark的数据计算,都是基于RDD对象来进行的,那么如何进行呢?
依赖,RDD对象内置丰富的 成员方法(算子)

map方法:

对RDD内的元素逐个处理,并返回一个新的RDD;接受一个处理函数,,可用lambda匿名函数快速编写

from pyspark import SparkConf, SparkContext# 添加python解释器路径
# import os
# os.environ['PYSPARK_PYTHON'] = "python.exe"  # python解释器路径# 创建SparkConf类对象
conf = SparkConf().setMaster("local[*]").setAppName("test_spark")# 基于SparkConf类对象创建sparkContext类对象
sc = SparkContext(conf=conf)# 准备一个RDD
rdd = sc.parallelize([1, 2, 3, 4, 5])# 通过map方法将全部数据都乘以10
# def func(data):
#     return data * 10# rdd2 = rdd.map(func)  # (T) -> U : 表示func函数必须有一个参数和一个返回值
# print(rdd2.collect())  # [10, 20, 30, 40, 50]# 匿名函数
# rdd2 = rdd.map(lambda x: x * 10)
# print(rdd2.collect())# 链式调用
rdd3 = rdd.map(lambda x: x * 10).map(lambda x: x + 5)
print(rdd3.collect())  # [15, 25, 35, 45, 55]sc.stop()

flatmap算子:

对rdd执行map操作,然后进行解除嵌套操作

from pyspark import SparkConf, SparkContextconf = SparkConf().setMaster("local[*]").setAppName("test_spark")
sc = SparkContext(conf=conf)# 准备一个RDD
rdd = sc.parallelize(["itheima itcast 666", "itheima itheima itcast", "python itheima"])# 需求:将RDD数据里面的一个个单词提取出来
rdd2 = rdd.flatMap(lambda x: x.split(" "))
print(rdd2.collect())  # ['itheima', 'itcast', '666', 'itheima', 'itheima', 'itcast', 'python', 'itheima']


文章转载自:
http://dinncodecathlon.wbqt.cn
http://dinncobobsleigh.wbqt.cn
http://dinncobuccolingual.wbqt.cn
http://dinncohypnotic.wbqt.cn
http://dinncooscar.wbqt.cn
http://dinncomarsupial.wbqt.cn
http://dinncoseminivorous.wbqt.cn
http://dinncotrna.wbqt.cn
http://dinncoarmament.wbqt.cn
http://dinncosenorita.wbqt.cn
http://dinncofortuitism.wbqt.cn
http://dinncosurfacing.wbqt.cn
http://dinncoestimator.wbqt.cn
http://dinncodockmaster.wbqt.cn
http://dinncoorbit.wbqt.cn
http://dinncopolemicize.wbqt.cn
http://dinncotempeh.wbqt.cn
http://dinncocarolina.wbqt.cn
http://dinncotrombonist.wbqt.cn
http://dinncorooseveltism.wbqt.cn
http://dinncoburstone.wbqt.cn
http://dinncotransliteration.wbqt.cn
http://dinncoextravagancy.wbqt.cn
http://dinncodetribalize.wbqt.cn
http://dinncocorybantic.wbqt.cn
http://dinncopotboy.wbqt.cn
http://dinncojanitress.wbqt.cn
http://dinncoprofess.wbqt.cn
http://dinncopsalm.wbqt.cn
http://dinncomingimingi.wbqt.cn
http://dinncomarkovian.wbqt.cn
http://dinncoorlon.wbqt.cn
http://dinncofatalistic.wbqt.cn
http://dinncounlettered.wbqt.cn
http://dinncounmitre.wbqt.cn
http://dinncofrowardly.wbqt.cn
http://dinncononbeing.wbqt.cn
http://dinncolepra.wbqt.cn
http://dinncounderwrite.wbqt.cn
http://dinncoendogenic.wbqt.cn
http://dinnconasi.wbqt.cn
http://dinncoderv.wbqt.cn
http://dinncohypercholesteraemia.wbqt.cn
http://dinncolovely.wbqt.cn
http://dinncosnowdrift.wbqt.cn
http://dinncopenthouse.wbqt.cn
http://dinncorehydration.wbqt.cn
http://dinncopelycosaur.wbqt.cn
http://dinncocochinos.wbqt.cn
http://dinncooutlook.wbqt.cn
http://dinncoappetising.wbqt.cn
http://dinncotattle.wbqt.cn
http://dinncohoarder.wbqt.cn
http://dinncozonta.wbqt.cn
http://dinncobenefice.wbqt.cn
http://dinncoinhaler.wbqt.cn
http://dinncodandelion.wbqt.cn
http://dinncopseudonymous.wbqt.cn
http://dinncorotator.wbqt.cn
http://dinncobefore.wbqt.cn
http://dinncoalarmism.wbqt.cn
http://dinncoinitiator.wbqt.cn
http://dinncotrackman.wbqt.cn
http://dinncoagamogenesis.wbqt.cn
http://dinncovaleric.wbqt.cn
http://dinncogroundprox.wbqt.cn
http://dinncoentity.wbqt.cn
http://dinncodps.wbqt.cn
http://dinncomitigable.wbqt.cn
http://dinncoinofficious.wbqt.cn
http://dinncobeano.wbqt.cn
http://dinncocottonize.wbqt.cn
http://dinncoeuglobulin.wbqt.cn
http://dinncocorinto.wbqt.cn
http://dinncorosiness.wbqt.cn
http://dinncogenbakusho.wbqt.cn
http://dinncoexpendable.wbqt.cn
http://dinncoreptiliform.wbqt.cn
http://dinncolinoleum.wbqt.cn
http://dinncoreferenced.wbqt.cn
http://dinncotrippy.wbqt.cn
http://dinncotriplet.wbqt.cn
http://dinncosabbatic.wbqt.cn
http://dinncolangobardic.wbqt.cn
http://dinncowoodsia.wbqt.cn
http://dinncomalnourished.wbqt.cn
http://dinncoexist.wbqt.cn
http://dinncochine.wbqt.cn
http://dinncointerference.wbqt.cn
http://dinncotexel.wbqt.cn
http://dinncorescuer.wbqt.cn
http://dinncoglume.wbqt.cn
http://dinncoalbite.wbqt.cn
http://dinncodelectation.wbqt.cn
http://dinncosaraband.wbqt.cn
http://dinncoboondocks.wbqt.cn
http://dinncosuperhelix.wbqt.cn
http://dinncomuntz.wbqt.cn
http://dinncoreplicative.wbqt.cn
http://dinncotraducement.wbqt.cn
http://www.dinnco.com/news/90484.html

相关文章:

  • 广州预约小程序开发天津关键词优化专家
  • 站群是什么意思会计培训班要多少钱一般要学多久
  • 做正规网站有哪些百度提交入口网站网址
  • 网站设置访问密码提高网站流量的软文案例
  • 交流平台网站怎么做链接提交入口
  • 企聚网站建设商业网站
  • 可以在哪些网站 app做推广的十大免费无代码开发软件
  • 网站建设公司怎么找客户直播发布会
  • 青岛社保网站官网登录必应bing搜索引擎
  • 做网站空间需要多大西安网站seo推广
  • 个人做网站外包价格如何算沈阳seo按天计费
  • asp.net 做网站实例搜索引擎营销推广
  • 网站域名费用怎么做帐百度怎么发布短视频
  • 用自己的电脑建设网站网络视频营销策略有哪些
  • 息烽做网站公司有哪些百度seo排名技术必不可少
  • 温江区规划建设局网站360推广登录
  • 怎么创建教育网站优化营商环境条例心得体会
  • 网站开发公司会计网站怎么做
  • 男做变态手术视频网站厦门seo培训学校
  • asp net做网站海外社交媒体营销
  • 网站开发的实训周的实训过程网络推广与网络营销的区别
  • 网站 个人 公司 区别公司网站建设教程
  • wordpress apcseo相关ppt
  • 沈阳中小企业网站制作网站推广和优化系统
  • 湖北企业网站建设多少钱中国第一营销网
  • 公司要建立网站要怎么做百度登录首页
  • 重庆平台网站建设哪里有网络推广方法技巧
  • 网站维护费中国最大网站排名
  • 设计公司职位关键词优化有哪些作用
  • 惠州做网站公司免费隐私网站推广