kafka(一:分区数据不均衡(数据倾斜),分区分配策略)
一:数据倾斜,导致各个分区数据不均匀。最终导致kafka堵塞,数据消费不动。
第一步:先停掉kafka中,上游和下游的代码,对分配数据较多的分区进行重新分配。
二:重新修改进入kafka的代码,防止进行后期继续发生数据倾斜。
可以设置一个新的列,根据这个列进行hash。
三:kafka默认自动存储在zk中。如果想存储到其他地方,例如mysql,需要手动进行修改。
kafka(一:分区数据不均衡(数据倾斜),分区分配策略)
一:数据倾斜,导致各个分区数据不均匀。最终导致kafka堵塞,数据消费不动。
第一步:先停掉kafka中,上游和下游的代码,对分配数据较多的分区进行重新分配。
二:重新修改进入kafka的代码,防止进行后期继续发生数据倾斜。
可以设置一个新的列,根据这个列进行hash。