本帖最后由 tohen 于 2013-09-27 17:09:45 编辑

解决方案 »

  1.   

    sb.ToString()是什么呢??贴出来
      

  2.   


    <li><a href=\"http://www.gd.gov.cn/gdgk/gdyw/201309/t20130926_185903.htm\">第95期\"广东学习论坛\"报告会举行 胡春华出席报告会</a><span class=\"time\">2013-09-26</span></li>\n           \t\n\t\t\t\t<li><a href=\"http://www.gd.gov.cn/gdgk/gdyw/201309/t20130927_185931.htm\">朱小丹率省政府代表团在法国访问 推动双方经贸合作</a><span class=\"time\">2013-09-27</span></li>\n           \t\n\t\t\t\t<li><a href=\"http://www.gd.gov.cn/gdgk/gdyw/201309/t20130926_185906.htm\">广州航海学院正式揭牌 陈云贤出席推动学院发展座谈会</a><span class=\"time\">2013-09-26</span></li>\n
      

  3.   


    <li><a href=\"http://www.gd.gov.cn/gdgk/gdyw/201309/t20130926_185903.htm\">第95期\"广东学习论坛\"报告会举行 胡春华出席报告会</a><span class=\"time\">2013-09-26</span></li>\n           \t\n\t\t\t\t<li><a href=\"http://www.gd.gov.cn/gdgk/gdyw/201309/t20130927_185931.htm\">朱小丹率省政府代表团在法国访问 推动双方经贸合作</a><span class=\"time\">2013-09-27</span></li>\n           \t\n\t\t\t\t<li><a href=\"http://www.gd.gov.cn/gdgk/gdyw/201309/t20130926_185906.htm\">广州航海学院正式揭牌 陈云贤出席推动学院发展座谈会</a><span class=\"time\">2013-09-26</span></li>\n
    估计还是转义字符造成的吧
    你上面给的html字符串,像引号这些都是转义了的,其实没有\这个符号的,只是用来转义引号的,所以正则表达式改成
    (?<=<li><a\s*href=\")(http:[^">]+)\">([^<]+)</a><span\s*[^>]*time[^>]*>(\d{4}-\d{2}-\d{2})
      

  4.   


    <li><a href=\"http://www.gd.gov.cn/gdgk/gdyw/201309/t20130926_185903.htm\">第95期\"广东学习论坛\"报告会举行 胡春华出席报告会</a><span class=\"time\">2013-09-26</span></li>\n           \t\n\t\t\t\t<li><a href=\"http://www.gd.gov.cn/gdgk/gdyw/201309/t20130927_185931.htm\">朱小丹率省政府代表团在法国访问 推动双方经贸合作</a><span class=\"time\">2013-09-27</span></li>\n           \t\n\t\t\t\t<li><a href=\"http://www.gd.gov.cn/gdgk/gdyw/201309/t20130926_185906.htm\">广州航海学院正式揭牌 陈云贤出席推动学院发展座谈会</a><span class=\"time\">2013-09-26</span></li>\n
    估计还是转义字符造成的吧
    你上面给的html字符串,像引号这些都是转义了的,其实没有\这个符号的,只是用来转义引号的,所以正则表达式改成
    (?<=<li><a\s*href=\")(http:[^">]+)\">([^<]+)</a><span\s*[^>]*time[^>]*>(\d{4}-\d{2}-\d{2})
    +1我以前也遇到过这样的问题 纠结了好久
      

  5.   


    <li><a href=\"http://www.gd.gov.cn/gdgk/gdyw/201309/t20130926_185903.htm\">第95期\"广东学习论坛\"报告会举行 胡春华出席报告会</a><span class=\"time\">2013-09-26</span></li>\n           \t\n\t\t\t\t<li><a href=\"http://www.gd.gov.cn/gdgk/gdyw/201309/t20130927_185931.htm\">朱小丹率省政府代表团在法国访问 推动双方经贸合作</a><span class=\"time\">2013-09-27</span></li>\n           \t\n\t\t\t\t<li><a href=\"http://www.gd.gov.cn/gdgk/gdyw/201309/t20130926_185906.htm\">广州航海学院正式揭牌 陈云贤出席推动学院发展座谈会</a><span class=\"time\">2013-09-26</span></li>\n
    估计还是转义字符造成的吧
    你上面给的html字符串,像引号这些都是转义了的,其实没有\这个符号的,只是用来转义引号的,所以正则表达式改成
    (?<=<li><a\s*href=\")(http:[^">]+)\">([^<]+)</a><span\s*[^>]*time[^>]*>(\d{4}-\d{2}-\d{2})正解! 太谢谢你了!