内容
({'fm':'as','F':'779317EA','F1':'9D73F1E4','F2':'4CA6DF6A','F3':'54E5243F','T':'1272521717','title':this.innerHTML,'url':this.href,'p1':4,'y':'FFF5D9F7'})" href="http://www.daodao.com/Hotel_Review-g187791-d641086-Reviews-111_B_B-Rome_Lazio.html"  target="_blank" ><font size="3">罗马<em>111</em> B&amp;B点评, <em>111</em> B&amp;B评论, 介绍 - 到到</font></a><br><font size=-1>罗马<em>111</em> B&amp;B:在到到中查看 8旅行者点评,真实照片,以及<em>111</em> B&amp;B的优惠信息,在罗马977家庭式酒店中排名第243,并在5分中评分4。<br><font color="#008000">www.daodao.com/Hotel_Review-g187791-d6410 ... 2009-6-24  </font> - <a href="http://cache.baidu.com/c?
如何获取标红部分内容即以 http://开头,以 .html结尾 的内容并分组

解决方案 »

  1.   

    ^http[s]?:\\/\\/([\\w-]+\\.)+[\\w-]+([\\w-./?%&=]*)?.html$
      

  2.   

    额,我希望是  <a[^>]*href=(['""]?)(?<URL>[^'""\s> ]*)\1[^> ]*>(?<TEXT>[^<]*)</a> 
    这种类型,即带(?<url>)这种,方便取值
      

  3.   

    我可以取到 news.163.com等网站的链接及链接标题但几大搜索引擎的搜索结果链接反正一个都取不到,不知道是什么原因。
      

  4.   


            string str = "({'fm':'as','F':'779317EA','F1':'9D73F1E4','F2':'4CA6DF6A','F3':'54E5243F','T':'1272521717','title':this.innerHTML,'url':this.href,'p1':4,'y':'FFF5D9F7'})\" href=\"http://www.daodao.com/Hotel_Review-g187791-d641086-Reviews-111_B_B-Rome_Lazio.html\" target=\"_blank\" >";
            System.Text.RegularExpressions.Regex reg = new System.Text.RegularExpressions.Regex(@"(?<=href="")(?<content>[^""]*)(?="")", System.Text.RegularExpressions.RegexOptions.IgnoreCase);
            System.Text.RegularExpressions.MatchCollection m = reg.Matches(str); //设定要查找的字符串
            for (int i = 0; i < m.Count; i++)
            {
                Response.Write(m[i].Groups["content"].ToString());
            }
      

  5.   


    楼主给的例子不完整,这个href是在<a...>...</a>标签中?给完整例子对于一般的取链接和文本,下面的正则基本上可以算是通用的
    Regex reg = new Regex(@"(?is)<a(?:(?!</?href=).)*href=""(?<url>[^""]*)""[^>]*>(?<text>(?:(?!</?a\b).)*)</a>");
    MatchCollection mc = reg.Matches(yourStr);
    foreach (Match m in mc)
    {
        richTextBox2.Text += m.Groups["url"].Value + "\n";      //链接
        richTextBox2.Text += m.Groups["text"].Value + "\n";     //文本
    }