内容
({'fm':'as','F':'779317EA','F1':'9D73F1E4','F2':'4CA6DF6A','F3':'54E5243F','T':'1272521717','title':this.innerHTML,'url':this.href,'p1':4,'y':'FFF5D9F7'})" href="http://www.daodao.com/Hotel_Review-g187791-d641086-Reviews-111_B_B-Rome_Lazio.html" target="_blank" ><font size="3">罗马<em>111</em> B&B点评, <em>111</em> B&B评论, 介绍 - 到到</font></a><br><font size=-1>罗马<em>111</em> B&B:在到到中查看 8旅行者点评,真实照片,以及<em>111</em> B&B的优惠信息,在罗马977家庭式酒店中排名第243,并在5分中评分4。<br><font color="#008000">www.daodao.com/Hotel_Review-g187791-d6410 ... 2009-6-24 </font> - <a href="http://cache.baidu.com/c?
如何获取标红部分内容即以 http://开头,以 .html结尾 的内容并分组
({'fm':'as','F':'779317EA','F1':'9D73F1E4','F2':'4CA6DF6A','F3':'54E5243F','T':'1272521717','title':this.innerHTML,'url':this.href,'p1':4,'y':'FFF5D9F7'})" href="http://www.daodao.com/Hotel_Review-g187791-d641086-Reviews-111_B_B-Rome_Lazio.html" target="_blank" ><font size="3">罗马<em>111</em> B&B点评, <em>111</em> B&B评论, 介绍 - 到到</font></a><br><font size=-1>罗马<em>111</em> B&B:在到到中查看 8旅行者点评,真实照片,以及<em>111</em> B&B的优惠信息,在罗马977家庭式酒店中排名第243,并在5分中评分4。<br><font color="#008000">www.daodao.com/Hotel_Review-g187791-d6410 ... 2009-6-24 </font> - <a href="http://cache.baidu.com/c?
如何获取标红部分内容即以 http://开头,以 .html结尾 的内容并分组
这种类型,即带(?<url>)这种,方便取值
string str = "({'fm':'as','F':'779317EA','F1':'9D73F1E4','F2':'4CA6DF6A','F3':'54E5243F','T':'1272521717','title':this.innerHTML,'url':this.href,'p1':4,'y':'FFF5D9F7'})\" href=\"http://www.daodao.com/Hotel_Review-g187791-d641086-Reviews-111_B_B-Rome_Lazio.html\" target=\"_blank\" >";
System.Text.RegularExpressions.Regex reg = new System.Text.RegularExpressions.Regex(@"(?<=href="")(?<content>[^""]*)(?="")", System.Text.RegularExpressions.RegexOptions.IgnoreCase);
System.Text.RegularExpressions.MatchCollection m = reg.Matches(str); //设定要查找的字符串
for (int i = 0; i < m.Count; i++)
{
Response.Write(m[i].Groups["content"].ToString());
}
楼主给的例子不完整,这个href是在<a...>...</a>标签中?给完整例子对于一般的取链接和文本,下面的正则基本上可以算是通用的
Regex reg = new Regex(@"(?is)<a(?:(?!</?href=).)*href=""(?<url>[^""]*)""[^>]*>(?<text>(?:(?!</?a\b).)*)</a>");
MatchCollection mc = reg.Matches(yourStr);
foreach (Match m in mc)
{
richTextBox2.Text += m.Groups["url"].Value + "\n"; //链接
richTextBox2.Text += m.Groups["text"].Value + "\n"; //文本
}