现在网上不少软件有正文识别功能,最近想写一个类似功能的插件,他们是什么原理呢?有知道的吗 比如采集侠的正文识别,准确度挺高的,有知道算法的能详细说下吗?他们的地址:http://www.caijixia.com/spider/  麻烦懂的人说下他们的算法