http://tech.163.com/special/000915I8/importantMore.html
例如你对这个页面的新闻进行采集,但是他会经常的更新,比如,这次的100条,到了下次就是105条了.?我只要采集更新的这5条???
例如你对这个页面的新闻进行采集,但是他会经常的更新,比如,这次的100条,到了下次就是105条了.?我只要采集更新的这5条???
调试欢乐多
建议将采集过的地址hash后保存,这样被查询内容是定长,而且长度也不会很长,索引效果会好很多。
2.在表里保存08/0219/05/451RVN7F000915BE 判断08/0219/05/451RVN7F000915BE是否采集过。
感谢大家提供的思路,呵呵,我再试试.