这段代码我该如何优化才能识别出更多的html标签！

public static String subValueHtml(String TDvalue){
TDvalue = TDvalue.toLowerCase();
if (TDvalue.indexOf("<a href") >= 0) {
TDvalue = TDvalue.substring(0, TDvalue
.indexOf("<a href"));
}
if (TDvalue.indexOf("<img src") >= 0) {
TDvalue = TDvalue.substring(0, TDvalue
.indexOf("<img src"));
}
if (TDvalue.contains(" ")) {
TDvalue = TDvalue.replaceAll(" ", "");
}
return TDvalue;
}
这段代码我该如何优化才能识别出更多的html标签！html优化java

解决方案 »

免费领取超大流量手机卡，每月29元包185G流量+100分钟通话, 中国电信官方发货

html标签都有自己的type，你何不用这个来判断是什么标签；而且你上面的判断方法也有问题；
你判断标签都给加了个属性，如果某个标签没有给这个属性赋值，没有在html上显示该属性的时候呢。
不是很明白lz想问什么。
为什么要有下面这段代码，也不是很清楚：
if (TDvalue.contains(" ")) {
TDvalue = TDvalue.replaceAll(" ", "");
}
我知道在读取xml文件时使用到Element，其中有一个方法是getName()，可以获取标签名称。
不知道html中有没有类似的。
你可以试试直接用jsoup这个类库，用法类似css选择器或jquery
我的目的是去掉 select '11111<a href=http://www.baidu.com'>百度</a>' from dual;
在表格展现的时候只展现11111百度，在导出这个表格的时候，值导出11111