若遍历资料夹内一堆资料夹(假设有10个),而这10个资料夹内.....每个都有txt档和装有txt档的资料夹...那想问一下...我如何才能够对比所有txt档的内容是否一样或相似呢?
希望这次有大大能帮助我解决问题

解决方案 »

  1.   

    1. 遍历文件夹下的txt文件
    2. 读取这些txt文件的内容使用MD5加密,把文件的路径和MD5码存储到如Map中
    3. 比较Map里每个文件的MD5,如MD5码相同,则txt文档的内容相同,否则不相同。
      

  2.   

    比较文件名称 和 文件的size才是正道吧
    这两个应该是可以确认唯一文件了吧md5固然准确 但是大文件处理的话耗时吧....
      

  3.   


    啊...MD5..是什么东东...还有那个Map?
      

  4.   

    比较文件的名字、文件的Size和 文件的内容 比较内容可以用重写equals(),HashCode方法;
      

  5.   

    是否相同我觉得用2楼的方法可以,但是是否相似的话这东西就比较恶心了,需要用一个算法去搞,贝叶斯算法,你把所有的txt都当成样本,然后遍历其中一个,算他的相似概率,最后看概率最大的那个落在那个样本类型中