存储大文件用hadoop里的HDFS,存小文件,可以参考阿里巴巴淘宝图片的实现原理。在数据增长如此快的时代,hadoop更有潜力,但处理小文件是有问题的,谁让hadoop生来就是处理大规模日志数据的呢! 磁盘IO性能本来就不高,无论用什么工具都很难明显提升其性能,除非参考磁阵模式,做多磁盘同步读写。