理论上其实也没什么。就是HTTPWebRequest和HTTPWebResponse发送和获取新闻网址的Stream,再进行分析,提取有用的部分。不过分析的工作量很大,而且可能需要支持多重过滤。

解决方案 »

  1.   

    获得的Stream是一个html格式的字符串流,你需要定义分离的起始字符串和结束字符串,并取出这个字符串之间的内容,也许第一次取出的内容还不符合你的要求,可能你还需要从中去掉某些html代码,所以你必须进行第二次过滤,也许要经过多次操作才能取出合适的内容,这时你还需要判断一下是否你的数据库已经有了这条新闻,只有没有的才保存。
      

  2.   

    如果用HTTPWebRequest和HTTPWebResponse,理论上是可实现的,但是难道较大,同时如果你连接的网页改版,你所有的工作就白做了。
    好像有些网站提供新闻连接的代码,自己试试吧,不过天下没有白吃的午餐。