.meta 文件损坏导致 datanode 进程无法启动
1.案例
2019年5月1日,yz-4m1-01集群的hadoop033节点主机重启后,datanode进程无法启动
2.查看日志
在 datanode 的【角色日志详细信息】中发现数条关于无法读取.meta 文件的报错:
3.登录主机核实
以第一条报错为例,我们进入到
/data/hdfsdsk09/data/current/BP-1981380748-192.168.116.201-1398150807170/current/finalized/subdir48/subdir46/目录下,发现该条报错中提到的 meta 文件的属主、属组和权限等信息显示异常。
4.原因
hdfsdsk09 磁盘下的某几个 meta 文件损坏,导致 datanode 进程无法启动。
5.解决方法
修复 hdfsdsk09 磁盘
①以 sudo 权限取消 hdfsdsk09 的挂载
命令:sudo umount /data/hdfsdsk09
②fsck 修复磁盘
命令:sudo fsck /data/hdfsdsk09
③启动 datanode
在 CM 页面启动 datanode
如果磁盘无法通过 fsck 命令修复,就找主机侧,让他们用 root 用户格式化磁盘,然后我们按照坏盘故障来处理。
欢迎来撩 : 汇总all