public static String subValueHtml(String TDvalue){
TDvalue = TDvalue.toLowerCase();
if (TDvalue.indexOf("<a href") >= 0) {
TDvalue = TDvalue.substring(0, TDvalue
.indexOf("<a href"));
}
if (TDvalue.indexOf("<img src") >= 0) {
TDvalue = TDvalue.substring(0, TDvalue
.indexOf("<img src"));
}
if (TDvalue.contains("&nbsp;")) {
TDvalue = TDvalue.replaceAll("&nbsp;", "");
}
 return TDvalue;
}
这段代码我该如何优化才能识别出更多的html标签!html优化java

解决方案 »

  1.   

    html标签都有自己的type,你何不用这个来判断是什么标签;而且你上面的判断方法也有问题;
    你判断标签都给加了个属性,如果某个标签没有给这个属性赋值,没有在html上显示该属性的时候呢。
      

  2.   

    不是很明白lz想问什么。
    为什么要有下面这段代码,也不是很清楚:
    if (TDvalue.contains("&nbsp;")) {
     TDvalue = TDvalue.replaceAll("&nbsp;", "");
     }
    我知道在读取xml文件时使用到Element,其中有一个方法是getName(),可以获取标签名称。
    不知道html中有没有类似的。
      

  3.   

    你可以试试直接用jsoup这个类库, 用法类似css选择器或jquery
      

  4.   

    我的目的是去掉 select '11111<a href=http://www.baidu.com'>百度</a>' from dual;
    在表格展现的时候只展现11111百度,在导出这个表格的时候,值导出11111