解密HDFS如何判断磁盘存储大小，存储动态负载均衡的？ - 大数据

1. HDFS对底层的磁盘存储如何选择的？

一个HDFS集群，会有很多个datanode节点，每个datanode节点会挂载很多块磁盘。HDFS在存储数据时如何动态负载均衡最优化地往每个datanode,每个磁盘上存储数据呢？

其实没啥，DataNode在运行过程中，为了计算DN的capacity使用量，实现数据存储的动态均衡，DN会对已配置的数据存储路径（dfs.datanode.data.dir）进行du -sk操作，以此获得capacity使用量汇报给NN中，然后NN就知道哪些DN有空间能被写数据进去，哪些是空间不足的。