一个网页中,有这样的一段:<FONT class="c_green">007:大破量子危机</FONT>
希望能提取出 “007:大破量子危机”这段文字,
能否通过一条正则表达式做到?
多谢帮助

解决方案 »

  1.   

    Pattern p = Pattern.compile(“007:大破量子危机”);
    Match m = p.matcher(....);
    while(m.find()){
    .......
    }
      

  2.   

    最好的方法是你把这个HTML 转换成标准的XML形式。
    然后通过Xpath来查找,这样最好。
    当然如果你的HTML中能保证都是以“ <FONT class="c_green">”开始以"</FONT>"结束的话,可以用这样: public static void main(String[] args) {
    String html = "<FONT class=\"c_green\">007:大破量子危机 </FONT>"; 
    Pattern pattern = Pattern.compile("<FONT class=\"c_green\">([^<]+)</FONT>"); 
            Matcher m = pattern.matcher(html); 
            while(m.find()) { 
             String findStr = m.group();
             findStr = findStr.replaceAll("<FONT class=\"c_green\">", "");
             findStr = findStr.replaceAll("</FONT>", "");
                System.out.println(findStr); 
            } 
    }
      

  3.   


    这个方法还是要获取了这个标签,然后在java中进一步处理的,
    但是目前是希望,直接通过正则,取得标签体中的文本。
    不知可否做到?
    非常感谢:)