各位大侠,做过 web 数据采集,能给我源码吗?非常感谢!

解决方案 »

  1.   

    页面上放一个按钮,一个层(runat="server")
    protected void Button1_Click(object sender, EventArgs e)
    {
    string strResult = "";
    HttpWebRequest request = (HttpWebRequest)WebRequest.Create(@"http://www.dangdang.com");
    request.Method = "GET";
    HttpWebResponse response = (HttpWebResponse)request.GetResponse();
    Stream streamReceive = response.GetResponseStream();
    Encoding encoding = Encoding.GetEncoding("gb2312");
    StreamReader streamReader = new StreamReader(streamReceive, encoding);
    strResult = streamReader.ReadToEnd();
    div1.InnerHtml = strResult;
    }
      

  2.   

    最后一句改为div1.InnerText=strResult也可以;
      

  3.   

    获得的网页html代码放在strResult中,然后可以对其过滤,将需要的信息提取出来。
      

  4.   

    在CSDN 里面搜索我的下载资源就可以了。
      

  5.   

    string strResult = "";
    HttpWebRequest request = (HttpWebRequest)WebRequest.Create(@"http://www.dangdang.com");
    request.Method = "GET";
    HttpWebResponse response = (HttpWebResponse)request.GetResponse();
    Stream streamReceive = response.GetResponseStream();
    Encoding encoding = Encoding.GetEncoding("gb2312");
    StreamReader streamReader = new StreamReader(streamReceive, encoding);
    strResult = streamReader.ReadToEnd();
    div1.InnerHtml = strResult;
      

  6.   

    首先获取目标网站的源码,用httpwebrequest,webclient,xmlhttp等都可以,个人建议使用xmlhttp,在对比这三个的速度方面自我感觉比其它两个能快些。
    (获取列表什么的再弄一下)
    然后就利用正则分析出你想要的数据。
    然后再去掉那些html,css,js等标签,剩下的文本就是你要采集的内容了。
    关于图片等内容,需要特殊处理,将图片下载到本地,或者存到数据库中。