解决方案 »

  1.   

    md5简单粗暴啊
    你是怎样定义“相同的文档”?
    文档有文件名,后缀,内容3个基本属性,都相同,还是只内容相同,就被称为相同的文档?我之前的做法是结合数据库,那时没考虑重复,根据文件名,上传时间和用户id生成md5,然后将文件保存在/2015-01/30/{md5}/原文件名.txt,文件名保留,文件夹随机,最后所有属性统统入库即可。
      

  2.   

    同一文件,不同名字,MD5值相同。
    MD5的典型应用是对一段Message(字节串)产生fingerprint(指纹),以防止被“篡改”。他只对信息加密。名字不验证。
      

  3.   

    hash值比较是正解,文件名不影响文件的hash值.
      

  4.   

    1、检查文件名不就行了吗
    2、不知道你这里的MD5是指对文件名还是文件内容做MD5