小弟在做一个数据整理的工作,遇到这样一个问题。比如现在数据表里面有两条含有地址信息的记录:如“北京市海淀区XXX路15号”和“北京海淀区XXX路15号”。如果凭肉眼去判定。这两条记录肯定是一样的。但是现在需要用程序去判定。我打算用自定义函数。小弟想问的是这个算法应该怎么样去写?思路是?

解决方案 »

  1.   

    人怎么判断机器就怎么判断。你先把规则整理清楚了,实现只是机械化的。
      

  2.   

    嗯。因为这个得做字符串分割。通过分割后再去比对。正则表达式?能给出两实例吗?谢了!
      

  3.   

    这里学问可大了,应该是智能分词吧,搜索引擎的方式,然后再加上字典表示哪些是相同的,再拼起来,挺麻烦