我正在运行hadoop,并且在集群中有两个配置完全相同的服务器。它们运行相同的任务,相同的配置,相同的一切,并且两者都是完全专用的hadoop任务节点(工作者)。
我正在通过这个集群运行的作业是高度IO绑定的。
在一台服务器上,我看到了IO的60-100MB/sec和5-10的CPU load,在另一台服务器上,我看到了40-60MB/sec的IO和一个CPU load of 60-90 (就运行一个简单的外壳而言,这个盒子几乎是不可用的)。
我已经运行了smartctl,没有收到任何磁盘警告。

我下一步要做什么来找出这些盒子之间的根本区别,有什么建议吗?经过几个小时的处理,这些结果是一致的。
发布于 2013-07-17 21:14:08
它感觉到4096字节物理/512字节逻辑磁盘扇区上的分区未对齐。
https://stackoverflow.com/questions/16519477
复制相似问题