Hbase的region server挂了之后没有被HMaster检测到的问题?

0
rt,一个节点的rs由于某些原因崩溃了,启动也失败。这个时候ZooKeeeper上的相应ZNode应该被清除了才对,HMaster将之移除。然而并没有,HMaster上没有意识到要将该region server剔除,UI上仍把它当做活的region server,导致某些访问失败。
由于问题无法复现,目前只有日志,没有办法得知当时的ZNode是否真的被删除。希望大神能够帮忙看看 ,这个问题我该怎么去定位呢 ?谢谢!
 
已邀请:
0

zhanmsl - 就一技术男 2016-01-21 回答

一般是不存在这种情况的
HMaster监控RegionServer的信息会保存在Zookeeper上的,可以尝试清空Zookeeper相关hbase目录的信息后,冲刺HBase相关服务
 
其实最有效的方法还是看日志,因为只有描述,所以只能进行简单的尝试。

要回复问题请先登录注册