mysql中 news表id subject contents(文章内容)1 文章一  省政府二大院位于贤士二路,1 文章二  nbsp;省政府二大院位于贤士二路,很大
这是二篇文章,如果二篇文章相似度超过95%,那就只显示其中任何一篇,现问:1 需屏掉html标签再考虑
2 如何用mysql 实现
thanks
这是二篇文章,如果二篇文章相似度超过95%,那就只显示其中任何一篇,现问:1 需屏掉html标签再考虑
2 如何用mysql 实现
thanks
用strip_tags()文章相似度超过95%
用mysql的全文索引,表类型用MyISAM
屏掉html标签需要用到正则匹配替换而判断两篇文章的相似度不能用一般语句来完成,需要用到一些文本匹配相似度算法,这个不是那么容易实现的