从网页中提取内容(高分) 我想从一个别人的网页中提取数据,这个数据是随时更新的。我想把它保存到数据库中。请问该怎么做。 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 如果不需要身份验证,很简单,用下面方法即可得到源代码,如果需要身份验证会麻烦些,注意网页的编码 // 获取指定网页的HTML代码 static string GetPageSource(string URL) { Uri uri = new Uri(URL); HttpWebRequest hwReq = (HttpWebRequest)WebRequest.Create(uri); HttpWebResponse hwRes = (HttpWebResponse)hwReq.GetResponse(); hwReq.Method = "Get"; hwReq.KeepAlive = false; StreamReader reader = new StreamReader(hwRes.GetResponseStream(), System.Text.Encoding.GetEncoding("UTF-8")); return reader.ReadToEnd(); } 这里需要注意的只有一点System.Text.Encoding.GetEncoding("UTF-8") 这里的编码要视你要取得的网页的编码而定其它的方法如果只是应用可以不必理会,如果为了学习,参考一下MSDN吧正则要视你所要提取的内容而定的 http://www.microsoft.com/china/msdn/Archives/workshop/scrape.asp 组织结构的层次设计,等高人指点,在线等 大家帮忙看看这个问题出在哪? 这段代码怎么写,才能从已经建好的数据库的表中读取头像字段的字符串? xml C#中关于导出Excel的问题 一个关于XML文件校验和读取的问题 求教:关于剪贴版函数的问题 打包后无法访问数据库 dgv如何把选中行的 其中一列相加 请问C#中有类似javascript中的eval()的方法嘛?或有没有类似的解决办法? 初学正则表达式 困惑 请教:有谁知道Reportviewer 制作子报表的.在下遇到困难了.
// 获取指定网页的HTML代码
static string GetPageSource(string URL)
{
Uri uri = new Uri(URL);
HttpWebRequest hwReq = (HttpWebRequest)WebRequest.Create(uri);
HttpWebResponse hwRes = (HttpWebResponse)hwReq.GetResponse();
hwReq.Method = "Get";
hwReq.KeepAlive = false;
StreamReader reader = new StreamReader(hwRes.GetResponseStream(), System.Text.Encoding.GetEncoding("UTF-8"));
return reader.ReadToEnd();
}
System.Text.Encoding.GetEncoding("UTF-8") 这里的编码要视你要取得的网页的编码而定
其它的方法如果只是应用可以不必理会,如果为了学习,参考一下MSDN吧正则要视你所要提取的内容而定的