.net 采集数据

各位大侠，做过 web 数据采集,能给我源码吗?非常感谢！

解决方案 »

免费领取超大流量手机卡，每月29元包185G流量+100分钟通话, 中国电信官方发货

页面上放一个按钮，一个层（runat="server"）
protected void Button1_Click(object sender, EventArgs e)
{
string strResult = "";
HttpWebRequest request = (HttpWebRequest)WebRequest.Create(@"http://www.dangdang.com");
request.Method = "GET";
HttpWebResponse response = (HttpWebResponse)request.GetResponse();
Stream streamReceive = response.GetResponseStream();
Encoding encoding = Encoding.GetEncoding("gb2312");
StreamReader streamReader = new StreamReader(streamReceive, encoding);
strResult = streamReader.ReadToEnd();
div1.InnerHtml = strResult;
}
最后一句改为div1.InnerText=strResult也可以;
获得的网页html代码放在strResult中，然后可以对其过滤，将需要的信息提取出来。
在CSDN 里面搜索我的下载资源就可以了。
string strResult = "";
HttpWebRequest request = (HttpWebRequest)WebRequest.Create(@"http://www.dangdang.com");
request.Method = "GET";
HttpWebResponse response = (HttpWebResponse)request.GetResponse();
Stream streamReceive = response.GetResponseStream();
Encoding encoding = Encoding.GetEncoding("gb2312");
StreamReader streamReader = new StreamReader(streamReceive, encoding);
strResult = streamReader.ReadToEnd();
div1.InnerHtml = strResult;
首先获取目标网站的源码,用httpwebrequest,webclient,xmlhttp等都可以，个人建议使用xmlhttp,在对比这三个的速度方面自我感觉比其它两个能快些。
（获取列表什么的再弄一下）
然后就利用正则分析出你想要的数据。
然后再去掉那些html,css,js等标签，剩下的文本就是你要采集的内容了。
关于图片等内容，需要特殊处理，将图片下载到本地，或者存到数据库中。