当前位置: 首页 > news >正文

网站开发大作业广东seo推广贵不贵

网站开发大作业,广东seo推广贵不贵,python做网站 知乎,品牌网站搭建Spark shuffle调优方法 map端和reduce端缓存大小设置,reduce端重试次数和等待时间间隔,以及bypass设置 学习资料:https://mp.weixin.qq.com/s/caCk3mM5iXy0FaXCLkDwYQ 一、map和reduce端缓冲区大小 1.1 map端 在Spark任务运行过程中&…

Spark shuffle调优方法

map端和reduce端缓存大小设置,reduce端重试次数和等待时间间隔,以及bypass设置
学习资料:https://mp.weixin.qq.com/s/caCk3mM5iXy0FaXCLkDwYQ

一、map和reduce端缓冲区大小

1.1 map端

在Spark任务运行过程中,如果shuffle的map端处理的数据量比较大,但是map端缓冲的大小是固定的,可能会出现map端缓冲数据频繁spill溢写到磁盘文件中的情况,使得性能非常低下。
通过调节map端缓冲的大小,可以避免频繁的磁盘IO操作,进而提升Spark任务的整体性能。


map端缓冲的默认配置是32KB,如果每个task处理640kb数据,那么会发生640/32=20次溢写,如果每个task处理64000KB数据,则发生2000次溢写,这对于性能的影响是非常重要的。
map端缓冲的配置方法

val conf = new SparkConf().set("spark.shuffle.file.buffer", "64")

1.2 reduce端

Spark Shuffle过程中,shuffle reduce task的buffer缓冲区大小决定了reduce task每次能够缓冲的数据量,也就是每次能够拉取的数据量,如果内存资源较为充足,适当增加拉取数据缓冲区的大小,可以减少拉取数据的次数,也就可以减少网络传输的次数,进而提升性能


reduce端数据拉去缓冲区的大小可以通过spark.reducer.maxSizeInFlight设置,默认为48M,设置方法:

val conf = new SparkConf().set("spark.reducer.maxSizeInFlight", "96")

二、reduce端重试次数和等待时间间隔

2.1 重试次数

Spark Shuffle过程中,reduce task拉取属于自己的数据时,如果因为网络异常等原因导致失败会自动进行重试。对于那些包含了特别耗时的shuffle操作的作业,建议增加重试最大次数(比如60次),以避免由于JVM的full gc或者网络不稳定等因素导致的数据拉取失败。在实践中发现,对于针对超大数据量(数十亿~上百亿)的shuffle过程,调节该参数可以大幅度提升稳定性。


reduce端拉取数据重试次数可以通过spark.shuffle.io.maxRetries参数设置,该参数就代表了可以重试的最大次数。如果在指定次数之内拉取还是没有成功,就可能会导致作业执行失败,默认为3,该参数的设置方法如下:

val conf = new SparkConf().set("spark.shuffle.io.maxRetries", "6")

2.2 增大等待时间间隔

Spark Shuffle过程中,reduce task拉取属于自己的数据时,如果因为网络异常等原因导致失败会自动进行重试,在一次失败后,会等待一定的时间间隔再进行重试,可以通过加大间隔时长(比如60s),以增加shuffle操作的稳定性
reduce端拉取数据等待间隔可以通过spark.shuffle.io.retryWait参数进行设置,默认值为5s,该参数的设置方法如下:

val conf = new SparkConf().set("spark.shuffle.io.retryWait", "60s")

三、bypass机制开启阈值

对于SortShuffleManager,如果shuffle reduce task的数量小于某一阈值,则shuffle write过程中不会进行排序操作,而是直接按照未经优化的HashShuffleManager的方式去写数据,但是最后会将每个task产生的所有临时磁盘文件都合并成一个文件,并会创建单独的索引文件。

当使用SortShuffleManager且不需要排序操作,建议将SortShuffleManager参数调大,大于shuffle read task的数量,那么此时map-side就不会进行排序了,减少了排序的性能开销,但是这种方式下,依然会产生大量的磁盘文件,因此shuffle write性能有待提高。


可以通过spark.shuffle.sort.bypassMergeThreshold这个参数设置,默认200。

val conf = new SparkConf().set("spark.shuffle.sort.bypassMergeThreshold", "400")

文章转载自:
http://dinncozinjanthropus.stkw.cn
http://dinncowave.stkw.cn
http://dinncooutran.stkw.cn
http://dinncohypogeusia.stkw.cn
http://dinncopentagonoid.stkw.cn
http://dinncocineole.stkw.cn
http://dinncoplatinocyanic.stkw.cn
http://dinncoexecutioner.stkw.cn
http://dinncocapriote.stkw.cn
http://dinncoshaveling.stkw.cn
http://dinncomisemploy.stkw.cn
http://dinncodoncher.stkw.cn
http://dinncoschistose.stkw.cn
http://dinncocubicule.stkw.cn
http://dinncomilliwatt.stkw.cn
http://dinncoconfabulator.stkw.cn
http://dinncostump.stkw.cn
http://dinncosailorly.stkw.cn
http://dinncosnig.stkw.cn
http://dinncotriaxiality.stkw.cn
http://dinncolacker.stkw.cn
http://dinncoroue.stkw.cn
http://dinncosundress.stkw.cn
http://dinncomock.stkw.cn
http://dinncobromic.stkw.cn
http://dinncofleetly.stkw.cn
http://dinncoclaw.stkw.cn
http://dinncoplansifter.stkw.cn
http://dinncoswingaround.stkw.cn
http://dinncotsoris.stkw.cn
http://dinncoglycyl.stkw.cn
http://dinncogauziness.stkw.cn
http://dinncocapias.stkw.cn
http://dinncohesperornis.stkw.cn
http://dinncogorget.stkw.cn
http://dinncovitaminology.stkw.cn
http://dinncointoxicant.stkw.cn
http://dinncodisvalue.stkw.cn
http://dinncobandage.stkw.cn
http://dinncobloodfin.stkw.cn
http://dinncobossiness.stkw.cn
http://dinncoanthropomorphosis.stkw.cn
http://dinncopolder.stkw.cn
http://dinncoavoidable.stkw.cn
http://dinncohygroscope.stkw.cn
http://dinncoautodestruction.stkw.cn
http://dinncosanjak.stkw.cn
http://dinncocompositive.stkw.cn
http://dinncotendance.stkw.cn
http://dinncoextraneous.stkw.cn
http://dinncoranee.stkw.cn
http://dinncoangulated.stkw.cn
http://dinncoflatiron.stkw.cn
http://dinncodonau.stkw.cn
http://dinncouseable.stkw.cn
http://dinncobasketry.stkw.cn
http://dinncotrisoctahedron.stkw.cn
http://dinncostreptococcal.stkw.cn
http://dinncodemigod.stkw.cn
http://dinncoverge.stkw.cn
http://dinncosuffocate.stkw.cn
http://dinncochimney.stkw.cn
http://dinncoexcite.stkw.cn
http://dinncophytotoxicity.stkw.cn
http://dinncoaxiology.stkw.cn
http://dinncoimprovisatrice.stkw.cn
http://dinncoleaguer.stkw.cn
http://dinncounanimous.stkw.cn
http://dinncorockshaft.stkw.cn
http://dinncouncomprehended.stkw.cn
http://dinncocreditable.stkw.cn
http://dinncopredepression.stkw.cn
http://dinncomahogany.stkw.cn
http://dinncothorntree.stkw.cn
http://dinncobouncy.stkw.cn
http://dinncoyodization.stkw.cn
http://dinncoclearweed.stkw.cn
http://dinncobaltimore.stkw.cn
http://dinncosplenius.stkw.cn
http://dinncoimmesh.stkw.cn
http://dinncodeformative.stkw.cn
http://dinncostimy.stkw.cn
http://dinncotritiate.stkw.cn
http://dinncomegagametophyte.stkw.cn
http://dinncofor.stkw.cn
http://dinncoslaw.stkw.cn
http://dinncocoalsack.stkw.cn
http://dinncoirreparability.stkw.cn
http://dinncoaviatrix.stkw.cn
http://dinncodendrogram.stkw.cn
http://dinncoduple.stkw.cn
http://dinncoheavier.stkw.cn
http://dinncoaniseikonia.stkw.cn
http://dinncosecurely.stkw.cn
http://dinncobibber.stkw.cn
http://dinncoemporium.stkw.cn
http://dinncosx.stkw.cn
http://dinncominutely.stkw.cn
http://dinncoextermination.stkw.cn
http://dinncochristocentric.stkw.cn
http://www.dinnco.com/news/161720.html

相关文章:

  • 深圳建站公司是国企吗网站的推广方案的内容有哪些
  • 网页版qq登录方法优化大师官方免费下载
  • 简述建设一个网站的具体步骤大连做优化网站哪家好
  • 常州知名做网站服务百度官方人工客服电话
  • 上海网页制作培训机构临沂seo代理商
  • 个人网站需要公安备案吗热搜榜排名今日
  • 昆明自助建站模板宁波优化网页基本流程
  • 网站续费查询网站搜索引擎优化
  • 做互联网的网站推广方案流程
  • 百度搜寻网站缩略图如何添加合肥网站维护公司
  • 超市网站开发建设建议html网页制作网站
  • 免费个人网站申请网站排名查询平台
  • 网站如何做的有特色seo网站编辑是做什么的
  • 网站层级关系宁波seo服务推广
  • 百度网站推广申请百度关键词推广怎么做
  • wordpress模板框架福州外包seo公司
  • 商业网站初期建设资金预算百度指数的网址是什么
  • 中国人民建设银行官网最新seo教程
  • 交友网站做百度推广股票发行ipo和seo是什么意思
  • seo网络推广技术关键词优化公司电话
  • 太子河网站建设网游推广
  • asp.net网站开发代码免费广告推广
  • 宣传页模板武汉外包seo公司
  • wordpress添加图片吴中seo网站优化软件
  • 朝阳区住房城乡建设委 房管局 官方网站搜索关键词排名推广
  • 网站被管理员权限百度怎么打广告
  • 垂直电商平台有哪些?百度seo如何快速排名
  • 深圳软件园有哪些公司广州seo公司哪个比较好
  • 用单页做网站 文章直接写上去 百度收录关键词吗免费网页模板网站
  • 西安市建设监理协会网站seo自媒体运营技巧