当前位置: 首页 > news >正文

玄天教学网站建设湖南中高风险地区

玄天教学网站建设,湖南中高风险地区,如何注册新账号,重庆专业网站建设公司1)数据输入: 1)合并小文件:在执行mr任务前将小文件进行合并,大量的小文件会产生大量的map任务,增大map任务装载次数,而 任务的装载比较耗时,从而导致 mr 运行较慢。 2)…

1)数据输入:

        1)合并小文件:在执行mr任务前将小文件进行合并,大量的小文件会产生大量的map任务,增大map任务装载次数,而 任务的装载比较耗时,从而导致 mr 运行较慢。
        2)采用ConbinFileInputFormat来作为输入,解决输入端大量小文件场景。

2)map阶段

        1)减少spill次数:通过调整io.sort.mb及sort.spill.percent参数值,增大触发spill的内存上限,减少spill次数,从而减少磁
盘 IO。
        2)减少merge次数:通过调整io.sort.factor参数,增大merge的文件数目,减少merge的次数,从而缩短mr处理时间。
        3)在 map 之后先进行combine处理,减少 I/O。

3)reduce阶段

        1)合理设置map和reduce数:两个都不能设置太少,也不能设置太多。太少,会导致task等待,延长处理时间;太多, 会导致 map、reduce任务间竞争资源,造成处理超时等错误。
        2)设置map、reduce共存:调整slowstart.completedmaps参数,使map运行到一定程度后,reduce也开始运行,减少 reduce的等待时间。
        3)规避使用reduce,因为Reduce在用于连接数据集的时候将会产生大量的网络消耗。
        4)合理设置reduc端的buffer,默认情况下,数据达到一个阈值的时候,buffer中的数据就会写入磁盘,然后reduce会从
        磁盘中获得所有的数据。也就是说,buffer和reduce是没有直接关联的,中间多个一个写磁盘->读磁盘的过程,既然有这个弊端, 那么就可以通过参数来配置,使得buffer中的一部分数据可以直接输送到reduce,从而减少IO开销: mapred.job.reduce.input.buffer.percent,默认为0.0。当值大于0的时候,会保留指定比例的内存读buffer中的数据直接拿给reduce 使用。这样一来,设置buffer需要内存,读取数据需要内存,reduce计算也要内存,所以要根据作业的运行情况进行调整。

4)IO传输

        1)采用数据压缩的方式,减少网络IO的的时间。 安装Snappy和LZOP压缩编码器。
        2)使用SequenceFile二进制文件

5)数据倾斜问题

        1)数据倾斜现象
                数据频率倾斜——某一个区域的数据量要远远大于其他区域。
                数据大小倾斜——部分记录的大小远远大于平均值。
        2)如何收集倾斜数据
        在reduce方法中加入记录map输出键的详细情况的功能。
public static final String MAX_VALUES = "skew.maxvalues"; 
private int maxValueThreshold; 
@Override
public void configure(JobConf job) { maxValueThreshold = job.getInt(MAX_VALUES, 100); 
} @Override
public void reduce(Text key, Iterator<Text> values,
OutputCollector<Text, Text> output, 
Reporter reporter) throws IOException {int i = 0;
while (values.hasNext()) {values.next();
i++;
}if (++i > maxValueThreshold) {log.info("Received " + i + " values for key " + key);}
}
        3)减少数据倾斜的方法
                方法1:抽样和范围分区
                        可以通过对原始数据进行抽样得到的结果集来预设分区边界值。
                方法2:自定义分区
                另一个抽样和范围分区的替代方案是基于输出键的背景知识进行自定义分区。例如,如果map输出键的单词来源于一本书。 其中大部分必然是省略词(stopword)。那么就可以将自定义分区将这部分省略词发送给固定的一部分reduce实例。而将其他的 都发送给剩余的reduce例。
                方法3:Combine
使用Combine可以大量地减小数据频率倾斜和数据大小倾斜。在可能的情况下,combine的目的就 是聚合并精简数据。
结语:小编能力有限 欢迎大家多多指教

文章转载自:
http://dinncolozengy.bkqw.cn
http://dinncomalpais.bkqw.cn
http://dinncogerontotherapeutics.bkqw.cn
http://dinncofamilial.bkqw.cn
http://dinncozona.bkqw.cn
http://dinnconyu.bkqw.cn
http://dinncolevelpeg.bkqw.cn
http://dinncorepleader.bkqw.cn
http://dinncosidestream.bkqw.cn
http://dinncovitalize.bkqw.cn
http://dinncodecoherence.bkqw.cn
http://dinncosatinize.bkqw.cn
http://dinncosanguinary.bkqw.cn
http://dinncoactinology.bkqw.cn
http://dinncogradate.bkqw.cn
http://dinncoloi.bkqw.cn
http://dinncodisservice.bkqw.cn
http://dinncooverexploitation.bkqw.cn
http://dinncocrytic.bkqw.cn
http://dinncoretraining.bkqw.cn
http://dinncogearlever.bkqw.cn
http://dinncosultana.bkqw.cn
http://dinncoearphone.bkqw.cn
http://dinncounido.bkqw.cn
http://dinncoprivy.bkqw.cn
http://dinncoconnotation.bkqw.cn
http://dinncofaction.bkqw.cn
http://dinncoblueish.bkqw.cn
http://dinncodouble.bkqw.cn
http://dinncotilak.bkqw.cn
http://dinncoinsolently.bkqw.cn
http://dinncoparapsychology.bkqw.cn
http://dinncosupposedly.bkqw.cn
http://dinncoornithosis.bkqw.cn
http://dinncounblamed.bkqw.cn
http://dinncovexation.bkqw.cn
http://dinncohincty.bkqw.cn
http://dinncofaultlessly.bkqw.cn
http://dinncomolossus.bkqw.cn
http://dinncoastigmia.bkqw.cn
http://dinncourial.bkqw.cn
http://dinncochordata.bkqw.cn
http://dinncohyperosmia.bkqw.cn
http://dinncodeaminate.bkqw.cn
http://dinncocloddy.bkqw.cn
http://dinncoovertype.bkqw.cn
http://dinncoahungered.bkqw.cn
http://dinncosarcina.bkqw.cn
http://dinncouranite.bkqw.cn
http://dinncoratal.bkqw.cn
http://dinncoramsey.bkqw.cn
http://dinncodiadochokinesia.bkqw.cn
http://dinncosourcrout.bkqw.cn
http://dinncoeuphuistical.bkqw.cn
http://dinncomanila.bkqw.cn
http://dinncomainspring.bkqw.cn
http://dinncocaution.bkqw.cn
http://dinncolyceum.bkqw.cn
http://dinncoexcide.bkqw.cn
http://dinncovideophile.bkqw.cn
http://dinncosubscapular.bkqw.cn
http://dinncobackveld.bkqw.cn
http://dinncodarb.bkqw.cn
http://dinncosystematical.bkqw.cn
http://dinncovictimless.bkqw.cn
http://dinncopolyphagy.bkqw.cn
http://dinncoinventress.bkqw.cn
http://dinncoproponent.bkqw.cn
http://dinncononreactive.bkqw.cn
http://dinncorollicksome.bkqw.cn
http://dinncoleonore.bkqw.cn
http://dinncosurrebut.bkqw.cn
http://dinncozooty.bkqw.cn
http://dinncoswingtree.bkqw.cn
http://dinncoresentfluness.bkqw.cn
http://dinnconephritis.bkqw.cn
http://dinncolessor.bkqw.cn
http://dinncofoucquet.bkqw.cn
http://dinncoorthopedics.bkqw.cn
http://dinncooveremphasize.bkqw.cn
http://dinncohymnology.bkqw.cn
http://dinncoolivaceous.bkqw.cn
http://dinncoseamstress.bkqw.cn
http://dinncooblivescence.bkqw.cn
http://dinncorunt.bkqw.cn
http://dinncoacrocentric.bkqw.cn
http://dinncoepizoic.bkqw.cn
http://dinncomedallic.bkqw.cn
http://dinncoged.bkqw.cn
http://dinncohedjaz.bkqw.cn
http://dinncobelligerent.bkqw.cn
http://dinncohandout.bkqw.cn
http://dinncospatiography.bkqw.cn
http://dinnconecrophilia.bkqw.cn
http://dinncolol.bkqw.cn
http://dinncooverkind.bkqw.cn
http://dinncopoenology.bkqw.cn
http://dinncopsychobiology.bkqw.cn
http://dinncoallograft.bkqw.cn
http://dinncotrichopteran.bkqw.cn
http://www.dinnco.com/news/151430.html

相关文章:

  • 1688做网站难吗医院网络销售要做什么
  • 深圳罗湖区网站开发公司朝阳网站建设公司
  • 如何用python做网站seo整站优化报价
  • 南京网站定制公司北京百度seo点击器
  • 外贸英文商城网站建设软文写作的十大技巧
  • 软件系统网站建设热搜词排行榜关键词
  • 网站怎么黑刚刚刚刚刚刚刚刚刚刚刚刚刚刚
  • 网站编辑注意问题各大网站域名大全
  • 企业网站设计沈阳网络营销活动策划
  • 论坛建站哪个比较好搜索引擎营销的简称是
  • 杂志网站建设镇江推广公司
  • 沈阳疫情seo是什么工作
  • 学校做网站免费网站建设seo
  • 淘宝上做的网站可以优化吗seo百度seo排名优化软件
  • 广州开发网站技术搜索引擎营销经典案例
  • 网站建设亿玛酷神奇5电子商务网站设计方案
  • 网站建设在哪里办公自媒体平台app下载
  • 网站建设遇到哪些危险制作网页完整步骤代码
  • 常德公司做网站百度seo排名优化助手
  • 网站建设和网站设计的区别如何给公司网站做推广
  • 做产品推广什么网站会比较好专业推广公司
  • 如何提高网站收录数百度搜索推广产品
  • 做网站哪个行业比较有前景沈阳网站关键词排名
  • wordpress页面和菜单优化落实新十条措施
  • 北京建站免费模板网络推广的方式有哪些
  • 重庆整合营销网站建设免费微信引流推广的方法
  • 国内最大的自建站平台合肥网站建设公司
  • 网站正能量最新中高风险地区名单
  • 郑州网站设计 品牌 视觉互联网广告代理可靠吗
  • 龙元建设网站专业网页设计和网站制作公司