如何用正则表达式解析得到HTML文本中的Body里的内容?

解决方案 »

  1.   


    @"<body>[\s\S]*</body>"
      

  2.   


    Regex r = new Regex(@"<body.*>.*</body>");
    Match m = r.Match(你的html代码);
      

  3.   

    呵呵
    我是这样写的:Match m;
    m = Regex.Match(strResponse, @"(?<=<(body.*)>).*(?=<\/\1>)", RegexOptions.Singleline);
      

  4.   


    不行 如果你那个html是<body onload="">
    <table></table>
    </body>的话 你的正则是不匹配的 因为 你的捕获组的内容是body onload="" 
    给你修改一下Match m;
    m = Regex.Match(strResponse, @"(?<=<(body)[^>]*>).*(?=</\1>)", RegexOptions.Singleline);