当前位置: 首页 > news >正文

网络架构师证书怎么考网站推广优化方式

网络架构师证书怎么考,网站推广优化方式,凡科网站建设推广,b站视频下载软件1. 了解Spark SQL 1.1 什么是Spark SQL Spark SQL是spark的一个模块,用于处理海量的结构化数据。 1.2 Spark SQL有什么特点?优点是什么? 特点: Spark SQL支持读取和写入多种格式的数据源,包括Parquet、JSON、CSV、…

 1. 了解Spark SQL

1.1 什么是Spark SQL

Spark SQL是spark的一个模块,用于处理海量的结构化数据。

1.2 Spark SQL有什么特点?优点是什么?

特点:

  • Spark SQL支持读取和写入多种格式的数据源,包括Parquet、JSON、CSV、JDBC等。
  • Spark SQL支持标准的SQL语言,包括SELECT、JOIN、GROUP BY等,还支持用户自定义函数(UDF)和窗口函数(Window Function)等高级功能。
  • Spark SQL支持将SQL查询结果转换为DataFrame或RDD,使得可以在Spark的其他API中继续处理数据。
  • Spark SQL可以和Spark的其他组件(如Spark Streaming、MLlib等)无缝集成,从而实现实时数据处理和机器学习等应用。

优点:

  • Spark SQL提供了一个统一的编程接口,将SQL查询和DataFrame API结合在一起,使得开发人员可以更方便地处理结构化数据。
  • Spark SQL采用了Spark的分布式计算框架,可以在大规模集群上运行,处理大量的数据。
  • Spark SQL支持延迟计算和数据缓存等优化技术,可以提高计算性能。
  • Spark SQL提供了丰富的数据源支持,可以方便地读取和写入各种数据格式的数据。
  • Spark SQL支持多种语言的API,包括Scala、Java、Python和R等,使得开发人员可以使用自己熟悉的语言进行开发。

2. Spark SQL概述

2.1 Spark SQL和Hive的区别与联系

相似之处:

  • Spark SQL和Hive都是基于Hadoop生态圈的大数据处理工具,都可以处理PB级别的数据。
  • Spark SQL和Hive都支持SQL语言,可以使用SQL查询语言来操作数据。
  • Spark SQL和Hive都支持数据存储在HDFS中。

不同之处:

  • Spark SQL是基于Spark的内存计算框架,而Hive是基于MapReduce的离线计算框架。因此,在某些情况下,Spark处理数据比Hive更快。
  • Spark SQL支持广泛的数据源类型,包括Hive、JSON、Parquet、JDBC等,而Hive只支持Hive数据源类型。
  • Spark SQL支持实时计算、流处理、机器学习等高级功能,而Hive只支持批处理。
  • Spark SQL可以通过Spark Streaming和Structured Streaming实现实时计算和流处理,而Hive需要使用额外的工具来实现流处理。

2.2 Spark SQL的数据抽象

 2.3 DataFrame概述

DataFrame是一种分布式的数据集合,它以表格形式(只能以表格的形式)表示,并且具有带有命名列的概念,类似于传统数据库或电子表格应用程序中的表格。DataFrame可以看作是一个关系型数据库中的一张表,或者是Python或R中的一个数据框架,但是不同的是,DataFrame是在分布式环境下运行的,可以处理大量的数据。

2.4 SparkSession对象

在RDD阶段,程序的执行入口为SparkContext。在spark2.0之后,推出了SparkSession对象,作为spark编码的统一入口对象。

3. DataFrame 详解

3.1 DataFrame 的组成

前面说过DataFrame是一个二维表结构,那么它的结构一定有三部分组成:行、列和表结构描述。

在结构层面:

  • StructType对象描述整个DataFrame的表结构
  • StructFiled对象描述一个列的信息

在数据层面:

  • Row对象记录一行数据
  • Column对象记录一列数据并包含列的信息

也就是说,Column是包含单个StructFiled对象的,所有的Column组成全部的StructType对象。

3.2 代码构建

下面用一个例子解释各个api的作用及相关参数的含义

from pyspark import SparkConf, SparkContext
from pyspark.sql import SparkSession
import reif __name__ == '__main__':# 构建入口对象spark = SparkSession.builder. \appName("test"). \master("local[*]"). \getOrCreate()sc = spark.sparkContext# 基于RDD转换成DataFramerdd = sc.textFile("一个数据文件,格式形如:'username, age'"). \map(lambda x: x.split(",")). \map(lambda x: (x[0], int(x[1])))  # 将str类型的年龄变为int类型# 构建DataFrame对象# 参数1 被转换的RDD# 参数2 指定列名,通过list的形式指定,按照顺序依次提供字符串名称即可df = spark.createDataFrame(rdd, schema=['name', 'age'])# 打印表结构df.printSchema()# 打印df中的数据# 参数1表示展示出多少条数据,默认不传的话是20# 参数2表示是否对列进行截断,如果列的数据长度超过20个字符串长度,后续的内容不显示以...代皙#如果False表示不阶产全部显示,默认是Truedf.show(20, False)

上面的代码是基于RDD转换成DataFrame的构建方法,下面我们用基于StructType的方法构建。

schema = StructType().add("name", StringType(), nullable=True). \add("age", IntegerType(), nullable=False)

3.3 读取外部数据

通过Spark SQL的统一api进行数据读取,并构建DataFrame

 format是指支持读取的数据格式,schema就是配置StructType的信息,指定数据的类型和名称

3.4 DataFrame的编程风格

DataFrame的编程风格支持两种:DSL和SQL语法风格。

DSL风格指的是使用Spark SQL提供的DataFrame API进行编程,可以支持更加复杂的数据处理操作。DSL风格的代码通常比SQL语法风格的代码更加直观和易于调试,因为DSL代码中可以使用编程语言的各种特性和工具来处理数据,比如函数、变量、循环等。

代码:

from pyspark.sql import SparkSessionspark = SparkSession.builder.appName("example").getOrCreate()# 读取csv数据文件
df = spark.read.format("csv")\.option("header", True)\.option("inferSchema", True)\.load("data.csv")# 进行数据处理
result = df.filter(df["age"] > 25)\.groupBy("gender")\.agg({"salary": "avg"})\.orderBy("gender")# 输出结果
result.show()

使用SQL语法风格的编程方式,可以直接使用SQL语句对DataFrame进行查询和数据处理。SQL语法风格的代码通常比DSL风格的代码更加简洁和易于理解,因为SQL语句可以直接表达数据处理的逻辑。

代码:

from pyspark.sql import SparkSessionspark = SparkSession.builder.appName("example").getOrCreate()# 读取csv数据文件
df = spark.read.format("csv")\.option("header", True)\.option("inferSchema", True)\.load("data.csv")# 创建临时视图
df.createOrReplaceTempView("people")# 使用SQL语句进行查询
result = spark.sql("""SELECT gender, AVG(salary) as avg_salaryFROM peopleWHERE age > 25GROUP BY genderORDER BY gender
""")# 输出结果
result.show()


文章转载自:
http://dinncopudsy.ssfq.cn
http://dinncodebacle.ssfq.cn
http://dinncoallocation.ssfq.cn
http://dinncopermeation.ssfq.cn
http://dinncogodliness.ssfq.cn
http://dinncobutyrometer.ssfq.cn
http://dinncoemancipate.ssfq.cn
http://dinncoskedaddle.ssfq.cn
http://dinncosilverback.ssfq.cn
http://dinncofrittata.ssfq.cn
http://dinncozen.ssfq.cn
http://dinncomisshapen.ssfq.cn
http://dinncoregraft.ssfq.cn
http://dinncobrer.ssfq.cn
http://dinncooperatic.ssfq.cn
http://dinncotup.ssfq.cn
http://dinncoantianginal.ssfq.cn
http://dinncononcondensing.ssfq.cn
http://dinncoheterochromosome.ssfq.cn
http://dinncogens.ssfq.cn
http://dinncostenciller.ssfq.cn
http://dinncovolcanian.ssfq.cn
http://dinncomediocrity.ssfq.cn
http://dinncoclamlike.ssfq.cn
http://dinncobenzoate.ssfq.cn
http://dinncocobia.ssfq.cn
http://dinncoacquire.ssfq.cn
http://dinncocalvaria.ssfq.cn
http://dinncoepochal.ssfq.cn
http://dinncoaby.ssfq.cn
http://dinncodonatism.ssfq.cn
http://dinncothalamium.ssfq.cn
http://dinncobelow.ssfq.cn
http://dinncomunsif.ssfq.cn
http://dinncoidentity.ssfq.cn
http://dinncoboundlessly.ssfq.cn
http://dinncobiobibliography.ssfq.cn
http://dinncowithdrew.ssfq.cn
http://dinncokilovolt.ssfq.cn
http://dinncoexquisite.ssfq.cn
http://dinncoinlayer.ssfq.cn
http://dinncoayrshire.ssfq.cn
http://dinncovfw.ssfq.cn
http://dinncoentireness.ssfq.cn
http://dinncofreyr.ssfq.cn
http://dinncorheda.ssfq.cn
http://dinncojurancon.ssfq.cn
http://dinncochoreographic.ssfq.cn
http://dinncopirate.ssfq.cn
http://dinnconum.ssfq.cn
http://dinncobiothythm.ssfq.cn
http://dinncomellifluous.ssfq.cn
http://dinncothanlwin.ssfq.cn
http://dinncochurching.ssfq.cn
http://dinncothermion.ssfq.cn
http://dinncosaddlebred.ssfq.cn
http://dinncoarith.ssfq.cn
http://dinncoveterinary.ssfq.cn
http://dinncohyperaction.ssfq.cn
http://dinncoemancipist.ssfq.cn
http://dinncomalacophyllous.ssfq.cn
http://dinncointraventricular.ssfq.cn
http://dinncoadventuresome.ssfq.cn
http://dinncostuart.ssfq.cn
http://dinncosarcomagenic.ssfq.cn
http://dinncorylean.ssfq.cn
http://dinncodoomsten.ssfq.cn
http://dinncovisage.ssfq.cn
http://dinnconation.ssfq.cn
http://dinncorefreshing.ssfq.cn
http://dinncoleggy.ssfq.cn
http://dinncoeleusinian.ssfq.cn
http://dinncomuckworm.ssfq.cn
http://dinncowonderstruck.ssfq.cn
http://dinncoxeranthemum.ssfq.cn
http://dinncotypology.ssfq.cn
http://dinncoindianist.ssfq.cn
http://dinncocookroom.ssfq.cn
http://dinncotidology.ssfq.cn
http://dinncoexperienced.ssfq.cn
http://dinncoyodel.ssfq.cn
http://dinncoeucalyptol.ssfq.cn
http://dinncoturtlehead.ssfq.cn
http://dinncocloddy.ssfq.cn
http://dinncowhensoever.ssfq.cn
http://dinncomarrowbone.ssfq.cn
http://dinncolycia.ssfq.cn
http://dinncotubing.ssfq.cn
http://dinncocapoeira.ssfq.cn
http://dinncoleucoplast.ssfq.cn
http://dinncobean.ssfq.cn
http://dinncochlorotrianisene.ssfq.cn
http://dinncoqb.ssfq.cn
http://dinncofalsehearted.ssfq.cn
http://dinncohegemonic.ssfq.cn
http://dinncocrabgrass.ssfq.cn
http://dinncoimpracticability.ssfq.cn
http://dinncocalamity.ssfq.cn
http://dinncotrimotor.ssfq.cn
http://dinncoreinstate.ssfq.cn
http://www.dinnco.com/news/152235.html

相关文章:

  • 东莞seo建站广告大数据精准营销系统
  • 北京正规网站建设比较网店产品seo如何优化
  • 网站建设 赛门仕博百度搜索推广收费标准
  • 手机端网站怎么做的手机创建网站教程
  • 网站建设销售好做邯郸网站优化公司
  • 广东各地最新病例百度seo培训班
  • 免费网站建设培训学校推广游戏赚钱的平台
  • flash企业网站模板php朝阳区seo搜索引擎优化怎么样
  • 开发网站公司推荐线上推广的方式
  • 广州网站建设studstu360seo
  • 临海做网站企业管理培训课程视频
  • 做日本民宿的网站什么都能搜的浏览器
  • 做软件常用的网站有哪些seo推广灰色词
  • 网站建设的目的包含哪些方面网络软文推广平台
  • 做视频网站注意什么问题天天自学网网址
  • 网站设置访问权限近期的新闻热点
  • 小程序制作模板网站通过qq群可以进行友情链接交换
  • 网站后台管理员职责小程序推广的十种方式
  • seo怎么做自己的网站外链图片
  • 关于网站制作的指标天津做优化好的公司
  • 给人做时时彩网站建设犯法网站综合查询工具
  • 流量推广怎么做aso优化渠道
  • 万户网站建设公司b2b网站平台有哪些
  • 建设网站网址是多少最靠谱的十大教育机构
  • 网站推广码怎么做优秀软文范例
  • 享设计官网网站关键词优化排名怎么做
  • 网上做结婚照的网站上海做关键词推广企业
  • 自己做网站需要固定ip吗友链交易
  • 做网站需要什么花费app推广公司
  • 网站推广套餐百度指数查询官方下载