Hbase的region server挂了之后没有被HMaster检测到的问题?
0
rt,一个节点的rs由于某些原因崩溃了,启动也失败。这个时候ZooKeeeper上的相应ZNode应该被清除了才对,HMaster将之移除。然而并没有,HMaster上没有意识到要将该region server剔除,UI上仍把它当做活的region server,导致某些访问失败。
由于问题无法复现,目前只有日志,没有办法得知当时的ZNode是否真的被删除。希望大神能够帮忙看看 ,这个问题我该怎么去定位呢 ?谢谢!
由于问题无法复现,目前只有日志,没有办法得知当时的ZNode是否真的被删除。希望大神能够帮忙看看 ,这个问题我该怎么去定位呢 ?谢谢!
没有找到相关结果
重要提示:提问者不能发表回复,可以通过评论与回答者沟通,沟通后可以通过编辑功能完善问题描述,以便后续其他人能够更容易理解问题.
1 个回复
zhanmsl - 就一技术男 2016-01-21 回答
赞同来自:
HMaster监控RegionServer的信息会保存在Zookeeper上的,可以尝试清空Zookeeper相关hbase目录的信息后,冲刺HBase相关服务
其实最有效的方法还是看日志,因为只有描述,所以只能进行简单的尝试。