给你一个方法应该有点提示
 /**
     * 把一个html的字符串转换成网页上显示的字符串
     * @param String html, 原html格式的字符串
     * @return String, 转换后网页显示格式的字符串
     */
    public static String htmlToWeb ( String html )
    {
        ShowErr showerr = new ShowErr () ;
        if ( html == null || html.length () == 0 )
        {
            return "" ;
        }
        char[] c = html.toCharArray () ;
        StringBuffer sb = new StringBuffer () ;
        for ( int i = 0 ; i < c.length ; i++ )
        {
            switch ( c[ i ] )
            {
                case '>':
                    sb.append ( "&gt;" ) ;
                    break ;
                case '<':
                    sb.append ( "&lt;" ) ;
                    break ;
                case ' ':
                    sb.append ( "&nbsp;" ) ;
                    break ;
                case '"':
                    sb.append ( "&quot;" ) ;
                    break ;
                case '&':
                    sb.append ( "&amp;" ) ;
                    break ;
                case '\n':
                    sb.append ( "<br>" ) ;
                    break ;
                default:
                    sb.append ( c[ i ] ) ;
            }
        }
        return sb.toString () ;
    }

解决方案 »

  1.   

    主要是htm中有<table><tr><td>等等,都要出掉
      

  2.   

    http://www.javayou.com/article/index.jsp?type=published到这个网页看第一篇文章!绝对是你想要的东西
      

  3.   


      private String removehtmltag(String htmlstr) {
         Pattern pat = Pattern.compile("\\s*<.*?>\\s*",
                                      Pattern.DOTALL | Pattern.MULTILINE |
                                      Pattern.CASE_INSENSITIVE); 
        Matcher m = pat.matcher(htmlstr);
        //再去掉其它所有html标记
        String rs = m.replaceAll(" ");
        rs = rs.replaceAll("&nbsp", " ");
        rs = rs.replaceAll("&lt;", "<");
        rs = rs.replaceAll("&gt;", ">");
        return rs;
      }
      

  4.   

    就楼上的
     private String removehtmltag(String htmlstr) {
         Pattern pat = Pattern.compile("\\s*<.*?>\\s*",
                                      Pattern.DOTALL | Pattern.MULTILINE |
                                      Pattern.CASE_INSENSITIVE); 
        Matcher m = pat.matcher(htmlstr);
        //再去掉其它所有html标记
        String rs = m.replaceAll(" ");
        rs = rs.replaceAll("&nbsp", " ");
        rs = rs.replaceAll("&lt;", "<");
        rs = rs.replaceAll("&gt;", ">");
        return rs;
      }