hive 入库延迟排查

hive 入库延迟排查 SRC 层分钟表 hive 入库延迟排查 一、问题发现 2019-04-27 上午张 …

NameNode RPC 负载过高

NameNode RPC 负载过高 一、问题发现 2019-10-18 基于小文件问题与 XXX 和 XXX …

Job 报错失败

用户反映 JOB 执行失败报错,如下   怀疑为没有此目录权限 查找该目录下权限正常,但并无 map…

hive 任务中报内存不足

hive 任务中报内存不足

GC overhead limit exceeded 相关案例

GC overhead limit exceeded 相关案例 2019 年 5 月 13 日,4m1-01 …

hadoop集群数据倾斜任务排查实战记录

hadoop集群数据倾斜任务排查实战记录 一、问题发现 作业监控发现作业存在数据倾斜 问题排查 在 YARN …

推测执行hadoop

推测执行hadoop

  所谓推测式执行,就是计算框架判断,如果有一个task执行的过慢,则会启动备份任务,最终使用原任务…

集群作业执行缓慢问题排查 1

集群作业执行缓慢问题排查 1 问题发现 2022-05-07 XXX 告知 XXX 集群作业跑的很慢,提供作业…

慢作业之 日志打印问题hive udf

慢作业之 日志打印问题hive udf

慢作业问题 1.慢作业-日志打印问题 在 AA 集群中存在部分任务,执行较慢的情况。这些任务都是比较长的 hi…

kafka参数调优

kafka参数调优

kafka参数调优 1.broke 可以按如下配置 将自动生成 brokeid 自动识别 host.name …