有如下表:
NAME X Y
爱群大厦 971.75430 1310.57570
爱群大厦 996.40090 1301.87890
爱群大厦 986.27340 1301.71680
安华装饰 1264.81150 2839.83370
安华装饰城 1317.01650 2816.60010
安华装饰城 1264.81130 2839.90110
安华装饰城 1317.10930 2816.83230
安平村 2726.36910 5458.66500
安平村 2726.36910 5458.66500
安平村 2725.08450 5457.71580
安新路南 3155.67260 654.09090
安新路南 3155.67260 694.09090
坳岗 5019.27540 4771.57370
坳岗 5019.27540 4781.57370想要去掉重复数据,但如果只是name相同,但x列或y列里,相互的两个数减大于20,也不算冲数据
比如 爱群大厦 996.40090 1301.87890和 爱群大厦 971.75430 1310.57570 在X上相减大于20,就不算重复数据安华装饰城 在x列相减和Y列相减都有大于20的,除保留安华装饰城 1264.81130 2839.90110这条外,另外两条随机保留一条
想得到的结果:
爱群大厦 971.75430 1310.57570
爱群大厦 996.40090 1301.87890
安华装饰 1264.81150 2839.83370
安华装饰城 1317.01650 2816.60010
安华装饰城 1264.81130 2839.90110
安新路南 3155.67260 654.09090
安新路南 3155.67260 694.09090
NAME X Y
爱群大厦 971.75430 1310.57570
爱群大厦 996.40090 1301.87890
爱群大厦 986.27340 1301.71680
安华装饰 1264.81150 2839.83370
安华装饰城 1317.01650 2816.60010
安华装饰城 1264.81130 2839.90110
安华装饰城 1317.10930 2816.83230
安平村 2726.36910 5458.66500
安平村 2726.36910 5458.66500
安平村 2725.08450 5457.71580
安新路南 3155.67260 654.09090
安新路南 3155.67260 694.09090
坳岗 5019.27540 4771.57370
坳岗 5019.27540 4781.57370想要去掉重复数据,但如果只是name相同,但x列或y列里,相互的两个数减大于20,也不算冲数据
比如 爱群大厦 996.40090 1301.87890和 爱群大厦 971.75430 1310.57570 在X上相减大于20,就不算重复数据安华装饰城 在x列相减和Y列相减都有大于20的,除保留安华装饰城 1264.81130 2839.90110这条外,另外两条随机保留一条
想得到的结果:
爱群大厦 971.75430 1310.57570
爱群大厦 996.40090 1301.87890
安华装饰 1264.81150 2839.83370
安华装饰城 1317.01650 2816.60010
安华装饰城 1264.81130 2839.90110
安新路南 3155.67260 654.09090
安新路南 3155.67260 694.09090
a b c 为三条记录
如果a与b冲突,b与c冲突,a与c不冲突
那是留下a和c,还是留下b呢???
比如ABCD四条X列数据.
10 15 31 40
你是取10 31还是取10 40还是取15 40?