100万个文件,约300G左右,每个文件大小不超过400K,且位于不同文件夹下。
找出这些文件中相同的文件。我的想法,计算出所有文件的MD5然后再找出MD5相同的文件,得到相同的文件。
有没有更好的方法?