您的位置 首页 大数据运维

HBase 巡检

HBase 巡检

HBase 是使用 HDFS 作为底层存储的 NoSQL 数据库,提供了满足实时性和随即读写功能的数据库服务。

每日早晚巡检 HBase 服务,检查各集群的 HMaster 和 RegionServer 状态,是否事务积压等问题。

1.查看 CM HBase 的整体状态

 

1.HBase 的状态,目前看没有严重警告

2.查看集群读写请求量

3.查看总 Region 数,有 4 万+的 Region

平均每个 RegionServer 有 1000+的 region,已经比较高了,有风险

4.Master 状态查看,GC 时候有点高

5.查看单个 RegionServer 情况

 

2.查看备用 HMaster

每个库正常来说都有 3 个主节点,一个正在跑,两个备用,如图所示。

3.查看 Requests Per Second 和 Num. Regions

若为图中所示为 0,则需要登录主机查看,通常这种情况会发生在重启节点主机后发生

4.查看 Software Attributes

图中所示,比较重要的是两个标出部分:
1:代表着本库的 zookeeper 节点,如果出现异常,总数会不正常的
2:代表着本库的平均 region 数,理论超过 300 就要进行合并操作的,但这个是根据业务的需求进行操作,业务侧提出数据库卡顿了,再进行合并操作即可

5.查看 Dead Region ServeRegionServer

 

登录 HBase UI,若有 HBaseregionserver 宕掉的节点,则页面上会显示

出如下情况:

出现这种情况,则说明有非正常节点,可以尝试登陆该故障节点,查看故障原因(如 HBase 进程消失,主机意外重启,主机死机等)

 

欢迎来撩 : 汇总all

白眉大叔

关于白眉大叔linux云计算: 白眉大叔

热门文章