查找<,在查找>,把其中的内容去掉,递归以下,剩下的就是文字了

解决方案 »

  1.   

    import java.util.*;
    import java.util.regex.*;    String str="start<html>html</html>123<field>0000</field>end";
        String str1="<[^>]*>";
        System.out.println("原始字符串:\n"+str);
        Pattern p=Pattern.compile(str1);
        Matcher m=p.matcher(str);
        boolean f=m.find();
        StringBuffer sb=new StringBuffer();
        if(!f) {
          System.out.println("not find char\".\"");
        }
        while(f) {
          m.appendReplacement(sb,"\n");
          f=m.find();
        }
        m.appendTail(sb);
        System.out.println("提取后的字符串:\n"+sb.toString());
      

  2.   

    用正则表达式还有你的HTML应该是很规范的!