程序只需要抓取固定的网页,一共有5个吧!比如:http://www.163.com/news_list.html
http://www.sina.com/news_list.html
http://www.sohu.com/news_list.html
http://www.tom.com/news_list.html
http://www.21cn.com/news_list.html程序要定时抓取,每个网址就可以算作任务了。任务属性很多(抓取开始时间,结束时间,间隔时间,内容过滤,==)开始是这么想的,一共开启5个线程,在加5个定时器做间隔检测!这些线程循环着执行!后来看了些资料,对线程有点了解了。又想出一个方案。是这样的!开启一个线程,监视!对!就是这个定时器:(new System.Timers.Timer()),在做个任务列表,在加个队列,把满足抓取条件的任务放进队列里来(比如:间隔时间到了,。),定时器每隔1秒检查一次队列,有任务,就抓!我感觉这样的挺灵活,是不是做起来复杂度要大些!大家讨论一下,我也顺便吸取一下,前辈们的知识!
http://www.sina.com/news_list.html
http://www.sohu.com/news_list.html
http://www.tom.com/news_list.html
http://www.21cn.com/news_list.html程序要定时抓取,每个网址就可以算作任务了。任务属性很多(抓取开始时间,结束时间,间隔时间,内容过滤,==)开始是这么想的,一共开启5个线程,在加5个定时器做间隔检测!这些线程循环着执行!后来看了些资料,对线程有点了解了。又想出一个方案。是这样的!开启一个线程,监视!对!就是这个定时器:(new System.Timers.Timer()),在做个任务列表,在加个队列,把满足抓取条件的任务放进队列里来(比如:间隔时间到了,。),定时器每隔1秒检查一次队列,有任务,就抓!我感觉这样的挺灵活,是不是做起来复杂度要大些!大家讨论一下,我也顺便吸取一下,前辈们的知识!
单单5个,怎么弄都可以,有没有什么时间严格要求的一般这些新闻网页有rss吧?
最近正在做!~~~
呵呵
微观上是顺序开启线程,再说爬取的东西不一样,怎么可能一样呢 ?sleep我试过了,可以
爬完了让线程休息下,继续干活