A.Mapreduce 的 input split 就是一个 block;
B.input split 是一种记录的逻辑划分,而 block 是对输入数据的物理分割,两者之间有着本质的区别;
C.由于 Block 是本地的,DFSCline 可以不用向 DataNode 建立连接,直接读磁盘上的 文件;
D.为了发挥计算本地化性能,应该尽量使 inputSplit 大小与 block 大小相当;