解决方案 »

  1.   

            String string =
                    "<span id=\"thread_655680\"><a href=\"thread-655680-1-1.html\" style=\"font-weight: bold;color: #8F2A90\">[03-31] [美国AMC2013主打科幻末日剧][行尸走肉第四季][72P.HD-MP4][中英字幕][更新第14-16集]本季完</a></span><img src=\"images/attachicons/common.gif\" alt=\"附件\" class=\"attach\" /><span class=\"threadpages\">&nbsp;...<a href=\"thread-655680-2-1.html\">2</a><a href=\"thread-655680-3-1.html\">3</a><a href=\"thread-655680-4-1.html\">4</a><a href=\"thread-655680-5-1.html\">5</a><a href=\"thread-655680-6-1.html\">6</a>..<a href=\"thread-655680-15-1.html\">15</a></span></th><td class=\"author\"><cite><a href=\"space-uid-46.html\">高清电影</a></cite><em>2013-10-15</em></td><td class=\"nums\"><strong>142</strong>/<em>27991</em></td><td class=\"lastpost\"><cite><a href=\"space-username-zhf0323.html\">zhf0323</a></cite><em><a href=\"redirect.php?tid=655680&amp;goto=lastpost#lastpost\">2014-6-5 23:34</a></em></td></tr></tbody><tbody id=\"stickthread_653828\"><tr><td class=\"folder\"><a href=\"thread-653828-1-1.html\" title=\"新窗口打开\" target=\"_blank\"><img src=\"images/default/pin_1.gif\" alt=\"本版置顶\" /></a></td><td class=\"icon\">&nbsp;</td><th class=\"subject new\"><label>&nbsp;</label><span id=\"thread_653828\"><a href=\"thread-653828-1-1.html\" style=\"font-weight: bold;color: #8F2A90\">[05-21] [美国ABC最新动作科幻剧][神盾局特工第一季][720P.HD-MP4][中英字幕][更新第20-22集]</a></span>";
            String regex = "<span[\\s\\S]*?><a[\\s\\S]*?>(\\[\\d+-\\d+\\][\\s\\S]*?)</a>";
            Pattern pattern = Pattern.compile(regex);
            Matcher matcher = pattern.matcher(string);
            while (matcher.find()) {
                System.out.println(matcher.group(1));
            }
        
      

  2.   

    仅用split的解决办法
    public class StringSplit {    public static void main(final String[] args) {
            String string = "<span id=\\\"thread_655680\\\"><a href=\\\"thread-655680-1-1.html\\\" style=\\\"font-weight: bold;color: #8F2A90\\\">[03-31] [美国AMC2013主打科幻末日剧][行尸走肉第四季][72P.HD-MP4][中英字幕][更新第14-16集]本季完</a></span><img src=\\\"images/attachicons/common.gif\\\" alt=\\\"附件\\\" class=\\\"attach\\\" /><span class=\\\"threadpages\\\">&nbsp;...<a href=\\\"thread-655680-2-1.html\\\">2</a><a href=\\\"thread-655680-3-1.html\\\">3</a><a href=\\\"thread-655680-4-1.html\\\">4</a><a href=\\\"thread-655680-5-1.html\\\">5</a><a href=\\\"thread-655680-6-1.html\\\">6</a>..<a href=\\\"thread-655680-15-1.html\\\">15</a></span></th><td class=\\\"author\\\"><cite><a href=\\\"space-uid-46.html\\\">高清电影</a></cite><em>2013-10-15</em></td><td class=\\\"nums\\\"><strong>142</strong>/<em>27991</em></td><td class=\\\"lastpost\\\"><cite><a href=\\\"space-username-zhf0323.html\\\">zhf0323</a></cite><em><a href=\\\"redirect.php?tid=655680&amp;goto=lastpost#lastpost\\\">2014-6-5 23:34</a></em></td></tr></tbody><tbody id=\\\"stickthread_653828\\\"><tr><td class=\\\"folder\\\"><a href=\\\"thread-653828-1-1.html\\\" title=\\\"新窗口打开\\\" target=\\\"_blank\\\"><img src=\\\"images/default/pin_1.gif\\\" alt=\\\"本版置顶\\\" /></a></td><td class=\\\"icon\\\">&nbsp;</td><th class=\\\"subject new\\\"><label>&nbsp;</label><span id=\\\"thread_653828\\\"><a href=\\\"thread-653828-1-1.html\\\" style=\\\"font-weight: bold;color: #8F2A90\\\">[05-21] [美国ABC最新动作科幻剧][神盾局特工第一季][720P.HD-MP4][中英字幕][更新第20-22集]</a></span>";
            String[] splitArray = string.split("<|>");
            for (String splitString : splitArray) {
                if (splitString.length() > 0 && splitString.charAt(0) == '[') {
                    System.out.println(splitString);
                }
            }
        }
    }
    执行结果:
    [03-31] [美国AMC2013主打科幻末日剧][行尸走肉第四季][72P.HD-MP4][中英字幕][更新第14-16集]本季完
    [05-21] [美国ABC最新动作科幻剧][神盾局特工第一季][720P.HD-MP4][中英字幕][更新第20-22集]
      

  3.   

    这是要抓取别人的电影的title或者url吗
      

  4.   

    请问那个split("<|>")中的正则表达式是什么意思?  这么匹配我有点不明白,还请指教下~~
      

  5.   

    | 就是或者这个表达式代表用“<”或者“>”分割这个字符串