现在有两篇文章,我们老总的意思是对比文章的相似度,他的思路是:把文章里面的句子拆开,拆成一个个词语,然后按词语来对比两个文章的相似度难点:怎么知道一个句子里面哪个是词?
例:小明今天到我家来作客
拆分结果应该是去掉名词,形容词,动词,其结果应该是”作客“请问这样的功能怎么实现?
例:小明今天到我家来作客
拆分结果应该是去掉名词,形容词,动词,其结果应该是”作客“请问这样的功能怎么实现?
解决方案 »
- 我用C#做了一个计算器软件,可是把哪个exe文件出给别人。别人打不开。这个问题怎么解决?
- net2003求助,控件双击以后不能用.........(怀疑是微软的BUG)
- c# 加载mapx组件 不显示那个地图的小图标怎么回事?
- 用SqlDataAdapter批量更新数据为什么只执行Insert????附我的程序
- 如何判断byte[]中的数据全0
- 如何给datalist 里面的textbox 赋值
- 怎么动态添加同一控件多次?? ?
- 哪位有解决输入法自动变全角的补丁 KB925488,能分享一下吗?
- 实现把图片上传到数据库
- 几个comboBox都从access数据库中获取值,但是选择其中一个 另外的也都变了
- C# 获取网页数据 不通过HTML
- 自动提交带验证码的表单
方法2:复杂点的,要做一些算法设计 ,那个难度有点大,可以试着找个开源的看有没有。方法1处理不了以下内容:
研究生命科学 (研究 生命科学 /研究生、命、科学)。