我在做采集的,现在碰到这种情况,不知道怎么下手比如 某个网页内的连接都是这样的
<a href="/haha.html" />
我要取得他之前的完整路径
像 www.xxx.com/haha.html实在不懂怎么做
//取得html源码
public string GetHtml(string url)
{
string result = "";
try
{
WebRequest request = WebRequest.Create(url);
WebResponse response = request.GetResponse();
StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.GetEncoding("GBK"));
result = reader.ReadToEnd();
}
catch
{
result = "";
}
return result;
}
解决方案 »
- repeater中获取不到行中的文本框值,奇怪了
- 在asp.net 中有这样的时间控件吗?
- 禁用viewstate后DropDownlist的Text值怎么取
- 有人在asp.net中用过SQLite么?
- 如何在asp.net里使用js函数?
- 当鼠标 放在一幅图片上,下面出现很多链接;鼠标离开 下面的链接就不显示 ;请问这是怎么做的啊?
- 入门问题,郁闷啊
- C#中如何设置DataGrid的行高?
- 一个机器上装了.net和iis,另外一个机器值装了.net,如何用这太机器开发asp.net程序
- .net2003下不能新建asp.net项目,怎么搞的?
- 用户控件冲突问题
- web part无法调试,请各位大哥进来帮帮忙
//测试成功
string str = "<a href=\"/z/q160049681.htm\" target=\"_blank\">";
Regex re = new Regex(@"<a[^>]+href=\s*(?:'(?<href>[^']+)'|""(?<href>[^""]+)""|(?<href>[^>\s]+))\s*[^>]*>", RegexOptions.IgnoreCase | RegexOptions.Singleline);
MatchCollection mc = re.Matches(str);
Console.WriteLine(mc.Count);
foreach (Match m in mc)
Response.Write(m.Groups["href"].Value);//输出结果为:/z/q160049681.htm 本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/zhoukang0916/archive/2009/10/11/4654930.aspx