抓取网页中a标签href连接内容和a标签内的内容 分别插入到数据库表字段中href的连接必须是网址

解决方案 »

  1.   

    MatchCollection mc= Regex.Matches(str, @" <a[^> ]*href=([ ' " "]?)(? <url> [^ ' " "> \s]*)\1?[^> ]*> (? <text> [^ <]*) </a> ", RegexOptions.IgnoreCase);   
    foreach (Match m in mc)   
    {   
      Response.Write(m.Groups[ "url "].Value);   
      Response.Write(m.Groups[ "text "].Value);   
    }   
    Regex("(<a[^>]*href=)(['""]*/)");
    Regex reg = new Regex(@"(?is)(?<=<param [^>]*?name=""" + name + @"""[^>]*?value="")[^""]+(?="")");
      

  2.   

    httpwebrequest/webclient + Regexhttp://blog.sina.com.cn/s/blog_5e5a7c520100i0x8.html