请教各位兄弟,我现在有这样一个需求:
1、句库里有50多万条英文句子;
2、由用户给出一个任意句 S1,需要程序返回和 S1 有相同的单词最多的前100个句子。比如,用户的 S1 是:
This is a book and that is an apple.
程序可能返回:
This is an apple that is a book.
That is a cup and that is an apple.
……注意,有相同的单词数最多的句子要排在前面。现在我的问题是,按我以前的建库方法,当句库在几十万条以上时(以后可能更大),速度太慢(十几秒才能返回)。请各位兄弟给点如何建库、优化的建议,如何能进一步提高速度。谢谢啦!如哪位兄弟建议被采纳,再敬送200分聊表心意。