当前位置: 首页 > news >正文

山西专业制作网站香港疫情最新情况

山西专业制作网站,香港疫情最新情况,网络游戏开发商,西安旅游攻略4日游文章目录 背景分析 问题来了比较一开始的情况解决方式 背景 之前有分析过一次类似问题,最终结论是在keyby之后,其中有一个key数量特别庞大,导致对应的subtask压力过大,进而使得整个job不再继续运作。在这个问题解决之后&#xff…

文章目录

  • 背景
    • 分析
  • 问题来了
  • 比较一开始的情况
  • 解决方式


背景

之前有分析过一次类似问题,最终结论是在keyby之后,其中有一个key数量特别庞大,导致对应的subtask压力过大,进而使得整个job不再继续运作。在这个问题解决之后,后续又再次出现了积压的情况,针对这个问题进行排查分析。


分析

通过以下这张图,可以看到当前它是没有数据积压的。
在这里插入图片描述
可以看到source-map-map-sink/map都放在了同一个task中,因为Flink的operator chain(算子链)机制,数据是通过调用链接算子的processElement()方法,直接将数据推给下游处理了。这里有300个并行度,也就是有300个subtask,每个算子之间都是一一对应的,如果其中一个并行度的源一直没有消费到数据,那么它的下游就一样会是空闲的
在这里插入图片描述
通过这张图可以看到有的subtask根本就没有在处理数据,而有的处理的是大量的数据。那这种肯定不是我们想要的。这种情况,资源存在浪费。
在这里插入图片描述
在前后并行度不一致的时候,task之间就会默认采用rebalance做负载均衡
在这里插入图片描述
可以看到这种情况下,下游每个task处理的数据是比较平均的,在经过均衡之后
在这里插入图片描述

问题来了

到了这里就发现了个问题,竟然出现了严重的阻塞问题。
但仔细一看,并不是所有下游的subtask都是busy。
在这里插入图片描述
这种均衡之后部分阻塞的问题,经过代码,和实际的数据结合分析,我得出的结论是有一类数据,需要处理的时间是其他数据的几十倍。rebalance是轮询分配的,在某几个task接收到大量该类数据,导致它的运行压力直线上升,进而使得分配到此处时塞不进去了。即导致整体的阻塞。

比较一开始的情况

那么一开始为什么就没有阻塞呢,这一下就让人非常费解,明明rebalance负载均衡之后应该压力更小,更能够消费得过来才对,怎么现在就消费不来了呢。
在task中看到这样的日志,因为消费不来,很多该类topic的数据被丢弃了,因为没有阻塞,所以其他topic也就都能够正常消费。
在这里插入图片描述

解决方式

所以要解决这个问题的根本方式有两种
1、先把同一种数据需要耗费的时间与其他方式耗费时间差距较大的,进行缩小差距。
2、优化代码,让算子中的效率增加,处理每一条数据的时间减小
3、加大资源,增加并行度

http://www.dinnco.com/news/60291.html

相关文章:

  • 廊坊网站开发公司站长工具的使用seo综合查询运营
  • 亚马逊网站开发设计社区建站网站系统
  • 学网站开发前景济南网站seo
  • 网站建设 国风网络一键优化大师
  • 蚌埠市建设局网站找培训班一般在什么平台
  • 外贸建站与推广如何做 google国内搜索引擎排名
  • 建设部人力资源开发中心网站百度账号怎么注销
  • 手机淘宝客网站怎么做的郑州官网关键词优化公司
  • seo案例seo推广方法集合
  • 沈阳建设公司网站下载百度免费
  • 北京市住房与城乡建设厅网站春哥seo博客
  • 网站小程序怎么做优化游戏卡顿的软件
  • 加强政府网站建设seo的外链平台有哪些
  • ppt做书模板下载网站有哪些百度快速排名案例
  • 随州学做网站公司网站建设方案
  • 如何做网站程序百度服务热线
  • 广西建设厅网站首页百度账户托管运营
  • 邢台123网站口碑营销的产品有哪些
  • 付费网站怎么制作长春视频剪辑培训机构
  • 个人网站建设方案书模板火星培训机构收费明细
  • 福建泉州晋江市疫情最新消息福州短视频seo方法
  • wordpress页面定制青岛seo服务
  • 男女之间做那种事情视频网站搜索引擎seo关键词优化方法
  • 如何做配音网站域名注册哪个平台比较好
  • 昆明企业网站建设公司全能优化大师
  • 南京做电商网站的公司简介百度推广怎么赚钱
  • 电商运营怎么学关键字优化用什么系统
  • 微网站开发提供的服务百度seo营销推广多少钱
  • 商丘做网站手机导航下载2022新版
  • 网站建设优化是什么鬼南昌seo管理