现在有两篇文章,我们老总的意思是对比文章的相似度,他的思路是:把文章里面的句子拆开,拆成一个个词语,然后按词语来对比两个文章的相似度难点:怎么知道一个句子里面哪个是词?
例:小明今天到我家来作客
拆分结果应该是去掉名词,形容词,动词,其结果应该是”作客“请问这样的功能怎么实现?