<a href="/cnca/zwxx/xwdt/zxtz/342188.shtml" title="关于验收国家认监委2010年实验室能力验证项目暨征集2011年实验室能力验证项目的通知" target="_blank" >关于验收国家认监委2010年实验室能力验证项目暨征集2011年实验室能力验证项目的通知</a>
想抓取网页中类似a href="/cnca/zwxx/xwdt/zxtz/342188.shtml的所有链接,求正则表达式

解决方案 »

  1.   

    类似a href="/cnca/zwxx/xwdt/zxtz/342188.shtml的所有链接
    ====
    ??怎么个类似法?
      

  2.   

    (?is)<a[^>]*?href=(['"]?)[^'"]+\1[^>]*>[^<]+</a>
      

  3.   

    (?is)<a[^>]*?href=(['"]?)(?<url>/cnca/zwxx/xwdt/zxtz/\d+.shtml)+\1[^>]*>[^<]+</a>取url分组
      

  4.   

    是要提取类似“/cnca/zwxx/xwdt/zxtz”吗?
      

  5.   

    a href="/cnca/zwxx/xwdt/zxtz/342188.shtml
    a href="/cnca/zwxx/xwdt/zxtz/3421212.shtml
    a href="/cnca/zwxx/xwdt/zxtz/342212.shtml
    就是数字不一样
      

  6.   

    q107770540
    这位哥,谢了。
    (?is)<a[^>]*?href=(['"]?)(?<url>/cnca/zwxx/xwdt/zxtz/\d+.shtml)+\1[^>]*>[^<]+</a>
    (?is)<a[^>]*?href=(['""]?)(?<url>/cnca/zwxx/xwdt/zxtz/\d+.shtml)+\1[^>]*>[^<]+</a>
    少个双引号。哈哈
      

  7.   

    因为a的后面不一定接href属性,所以,应该用以下Regular Expressionstring re = "(href=\\")([\\w\\W]*?)(\\")";取的时候取正则出来的group数组的的[2]即可