求百度网页搜索结果、GOOGLE网页搜索结果、bing网页搜索结果、youdao网页搜索结果、yahoo网页搜索结果链接提取正则(不要搜索结果中广告的、快照的、翻页链接的

解决方案 »

  1.   

    MatchCollection mc= Regex.Matches(str, @" <a[^> ]*href=([ ' " "]?)(? <url> [^ ' " "> \s]*)\1?[^> ]*> (? <text> [^ <]*) </a> ", RegexOptions.IgnoreCase);   
    foreach (Match m in mc)   
    {   
      Response.Write(m.Groups[ "url "].Value);   
      Response.Write(m.Groups[ "text "].Value);   
    }   
    MatchCollection mc = Regex.Matches(Str, @"(?i)<a(?>(?:(?!href=)[^>])*)href=(['""]?)(?<url>[^""'\s>]*)\1[^>]*>(?<text>[\s\S]*?)</a>");