本帖最后由 yyy252999822 于 2012-07-08 22:46:56 编辑

解决方案 »

  1.   

    <div class="Content_" id="NewsContent">([\s\S]+?)</div>这样就能取得文章内容了。看不懂就是缺少基础,正则表达式看起来很绕,其实每个符号都有讲究的。
      

  2.   

    http://deerchao.net/tutorials/regex/regex.htm这篇文章很好,看一下就会了。比如 ?<= 叫“负向零宽断言”
    ?=叫“零宽度正预测先行断言”
    +、?、*、\s 之类的含义。
    ?is 就是忽略大小写。
      

  3.   

    修改成这样就可以了:(?is)(?<=<div\b[^>]*?id="NewsContent"[^>]*?>.*?<table[^>]*?><tr><td>).*?(?=</td></tr>.*?</table>)
      

  4.   

    不过我建议你最好写在这样:(?is)<div\b[^>]*?id=(['"]?)NewsContent\1[^>]*?>.*?<table[^>]*?><tr><td>(?<v>.*?)</td></tr>.*?</table>然后取 m.Groups["v"].Value