问题提出:在两个数千万到数亿记录的表中找出指定字段相同的记录。已有思路:将两个表切片,然后将数据分发到多台机器上去执行比对,问题是如果每个表切成10片,就会产生100个组合,同时分发到100台机器去执行显然不太可能。求更好的解决方案。