谁能告诉一个关于新闻抓取的C#代码。

解决方案 »

  1.   

    private string GetWebContent(string Url)   
    {   
    string strResult="";   
    try   
    {   
    HttpWebRequest request = (HttpWebRequest)WebRequest.Create(Url);   
        //声明一个HttpWebRequest请求   
    request.Timeout = 30000;   
    //设置连接超时时间   
    request.Headers.Set("Pragma", "no-cache");   
    HttpWebResponse response = (HttpWebResponse)request.GetResponse();   
    Stream streamReceive = response.GetResponseStream();   
    Encoding encoding = Encoding.GetEncoding("GB2312");   
    StreamReader streamReader = new StreamReader(streamReceive, encoding);   
    strResult = streamReader.ReadToEnd();   
    }   
    catch   
    {   
    MessageBox.Show("出错");   
    }   
    return strResult;   
    }   给你找来了。自己传个URL就行了。返回的是整个页面的源代码.至于详细的信息靠你自己来截取  可以用正则可以用INDEXOF SUBSTRING。
      

  2.   


    除非你跟你抓取的那个网站有合作,可以给你提供api,返回干净的新闻数据,一般是xml .但是,如果你想偷偷抓取别人网站的东西,现在大多数做法都是 获取 指定页面的html源码,
    在根据需要来截取,或者 通过正则来取自己需要的东西了