机器节点挂时,其他的datanode节点last contact也增大

我使用的hbase版本是0.98.6-cdh5.2.0,hadoop版本是2.5.0-cdh5.2.0
我遇到的问题是,当我手动关闭datanode或者该datanode节点宕机的时候,其他datanode节点last contact也不时地增大(超过3s),业务线也反馈查询和插入响应慢,直到过了10分30秒(退役超时时间)之后才恢复,我想问问原因是什么,是不是hdfs的一个bug
已邀请:

qgxiaozhan

赞同来自:

在挂掉一个节点的时候,hdfs需要恢复备份进行block复制,所以,可以先查看一下监控,看看在复制期间的带宽和磁盘压力情况如何。bug,个人感觉不至于,另外关注一下nn的rpc耗时之类的,没有更多的信息也很难说是什么问题?

要回复问题请先登录注册