mysql中 news表id      subject     contents(文章内容)1       文章一     省政府二大院位于贤士二路,1       文章二     nbsp;省政府二大院位于贤士二路,很大
这是二篇文章,如果二篇文章相似度超过95%,那就只显示其中任何一篇,现问:1 需屏掉html标签再考虑
   2 如何用mysql 实现
thanks

解决方案 »

  1.   

    仅仅依靠mysql完成这个工作 不容易哦!~~
      

  2.   

    需屏掉html标签再考虑
    用strip_tags()文章相似度超过95%
    用mysql的全文索引,表类型用MyISAM
      

  3.   


    屏掉html标签需要用到正则匹配替换而判断两篇文章的相似度不能用一般语句来完成,需要用到一些文本匹配相似度算法,这个不是那么容易实现的