问题就是如标题所述,想要计算两个字符串的相似度,去网上找了一下,发现大部分都是说 Levenshtein Distance(LD) 算法的,我也试过了这种算法,但是效率太低,达不到想要的要求!
需求是这样的,想做一个题库系统,需要判断当前录入的试题和当前已经存在的试题的相似状况,若相似度很高,就提醒用户,但是如果用 Levenshtein Distance(LD) 算法的话,需要将当前试题与当前已经存在的试题一一比较,这样的话时间上不允许,试题数量一旦多,文字一旦多,这时间可不是能够接受的,但是我看到某个试题库系统中实现的就很好,当用户按下保存按钮时,几乎同时给出试题相似度高的提醒,时间上非常短,几乎看不到什么延时,不知是如何实现的?