<a href='/Patent/01127847' target='_blank'>
<a href='/Patent/01127821' target='_blank'>
<a href='/Patent/01127832' target='_blank'>
还有其他的标签省略了正则要怎么样拿到01127847,01127821,01127832求高人指点

解决方案 »

  1.   


    <!DOCTYPE HTML>
    <html>
    <head>
    <meta charset="gb2312" />
    <title></title>
    <style>
    </style>
    </head>
    <body>
    <div>
    <a href='/Patent/01127847' target='_blank'>
    <a href='/Patent/01127821' target='_blank'>
    <a href='/Patent/01127832' target='_blank'>
    </div>
    <script>
    function $t(name, cot){
    cot = cot || document;
    return cot.getElementsByTagName(name);
    }
    var str = $t('div')[0].innerHTML;
    var re = /.+?Patent\/(\d+).+?/gi;
    var tmp = [];
    str.replace(re, function($){
    re.test($);
    re.lastIndex = 0;
    tmp.push( RegExp.$1 );
    })
    alert(tmp)
    </script>
    </body>
    </html>
      

  2.   

    Pattern pattern2 = Pattern.compile("(<a href='/Patent/([\\s\\S]*?)target='_blank'>)");
    Matcher matcher = pattern2.matcher(pageContent);
    while (matcher.find()) {
       strPage = matcher.group();
    }
    <a href='/Patent/01127847' target='_blank'>
    <a href='/Patent/01127821' target='_blank'>
    <a href='/Patent/01127832' target='_blank'>
    还有其他的标签省略了是这样的 java 代码   上面哪里出错了