C#字符串里面是HTML源码如何截取A标签的链接

Tuesday, November 03, 2009 2:16 AM <dir> <A HREF="/formularyupdate/PBMA/">PBMA</A>
 Tuesday, November 03, 2009 2:16 AM <dir> <A HREF="/formularyupdate/PBMB/">PBMB</A>
 Tuesday, November 03, 2009 2:16 AM <dir> <A HREF="/formularyupdate/PBMC/">PBMC</A>
 Tuesday, November 03, 2009 2:16 AM <dir> <A HREF="/formularyupdate/RXHUBPBM/">RXHUBPBM</A>
用c#截取每个a标签的链接，

解决方案 »

免费领取超大流量手机卡，每月29元包185G流量+100分钟通话, 中国电信官方发货

是要<A HREF="/formularyupdate/PBMA/">PBMA </A>
还是要/formularyupdate/PBMA/
var links = document.getElementsByTagName("a");
for(var i = 0; i < links.length; i++)
{
 //to do...
}
要<A HREF="/formularyupdate/PBMA/">PBMA </A>里面的/formularyupdate/PBMA/
string html = @" Tuesday, November 03, 2009 2:16 AM <dir> <A HREF=""/formularyupdate/PBMA/"">PBMA </A>
 Tuesday, November 03, 2009 2:16 AM <dir> <A HREF=""/formularyupdate/PBMB/"">PBMB </A>
 Tuesday, November 03, 2009 2:16 AM <dir> <A HREF=""/formularyupdate/PBMC/"">PBMC </A>
 Tuesday, November 03, 2009 2:16 AM <dir> <A HREF=""/formularyupdate/RXHUBPBM/"">RXHUBPBM </A>"; Regex reg = new Regex(@"(?is)<A\sHREF=""(.*?)"">([^>]+?)</A>");
 MatchCollection mc = reg.Matches(html);
 foreach (Match m in mc)
 {
 Console.WriteLine(m.Groups[0].ToString() +" 地址："+ m.Groups[1].ToString() + " 连接名："+m.Groups[2].ToString() + "\r\n");
 }
/*
<A HREF="/formularyupdate/PBMA/">PBMA </A> 地址：/formularyupdate/PBMA/ 连接名：PBMA<A HREF="/formularyupdate/PBMB/">PBMB </A> 地址：/formularyupdate/PBMB/ 连接名：PBMB<A HREF="/formularyupdate/PBMC/">PBMC </A> 地址：/formularyupdate/PBMC/ 连接名：PBMC<A HREF="/formularyupdate/RXHUBPBM/">RXHUBPBM </A> 地址：/formularyupdate/RXHUBPBM/ 连接名：RXHUBPBM
*/
string str="";
MatchCollection mc=Regex.Matches(str, @ " <a[^> ]*href=([ ' " "]?)(? <url> [^ ' " "> \s]*)\1?[^> ]*> (? <text> [^ <]*) </a> ", RegexOptions.IgnoreCase);
foreach (Match m in mc)
{
 Console.Write(m.Groups[ "url "].Value);
 Console.Write(m.Groups[ "text "].Value);
}
string strPattern=@"a[\s]+href=(? <Link>[^\s>]+)[^>]*>(? <Text>[^ <]*) </a>";
 MatchCollection Matches=Regex.Matches(str,strPattern,RegexOptions.IgnoreCase|RegexOptions.Compiled);
 foreach(Match mc in Matches)
 {
 Response.Write(mc.Groups["Link"].Value.ToString().Trim());
 Response.Write(mc.Groups["Text"].Value.ToString().Trim());
 }