<a href="htm_data/16/1310/579533.html" id="a_ajax_579533" target=_blank>我是逗逗</a><a href="htm_data/16/1310/2334(这个数字可变).html" id="a_ajax_2334(这个数字可变)" target=_blank>大小事儿全包</a><a href="htm_data/16/1310/993840.html" id="a_ajax_993840" target=_blank>我是小米</a>
htm_data/16/1310/之后的数字是变的。其他都是不变的。需要提取:我是逗逗
大小事儿全包了。
我是小米字样的正则表达式。我用的是:
foreach (Match m in Regex.Matches(zifuchuan, "正则")
{
m.Groups[1].Value.ToString();
}

解决方案 »

  1.   

    @"(?is)(?<=<a[^<>]+>).*?(?=</a>)"
      

  2.   

    (?i)<a\shref="htm_data/16/1310/\d+\.html"[^>]*?>([^<>]+)</a>
      

  3.   

    string strCqC =@"(?i)<a\s*href="htm_data/16/1310/\d+\.html"[^>]*?>([^<>]+)</a> ;
    foreach (Match m in Regex.Matches(strHtmlBody, strCqC ))
                {}
    这样写出错啦!
      

  4.   

    string strCqC =@"(?i)<a\s*href="htm_data/16/1310/\d+\.html"[^>]*?>([^<>]+)</a> ;
    =====
    明显双引号没转义string strCqC =@"(?i)<a\s*href=""htm_data/16/1310/\d+\.html""[^>]*?>([^<>]+)</a> ;
      

  5.   

    string strCC =@"(?i)<a\s*href=""htm_data/16/1310/\d+\.html""[^>]*?>([^<>]+)</a>";            foreach (Match m in Regex.Matches(strHtmlBody, strCC))
                {
                    myRow["帖子标题"] = m.Groups[0].Value;===================
    老大,没有提取出来我想要的东西呢。。
      

  6.   

      myRow["帖子标题"] = m.Groups[1].Value;