解析html代码的时候,有一个网站中有这样一段js代码:
<script type="text/javascript">
function hideToolTip()
{
document.getElementById('bubble_tooltip').style.display = 'none';

}
function showToolTip(e,text){
if(document.all)e = event;

var obj = document.getElementById('bubble_tooltip');
var obj2 = document.getElementById('bubble_tooltip_content');
obj2.innerHTML = text+"- <a href='http://202.118.208.142:8000/message/' class='wz' target='_blank'>新版学生系统</script></a><br>- <a href='http://202.118.208.142:8000/nefuapms' class='wz' target='_blank'>政工干部系统</a><br><div align='right'><a href='javascript:hideToolTip()' class='wz'>关闭</a></div>";
obj.style.display = 'block';
var st = Math.max(document.body.scrollTop,document.documentElement.scrollTop);
if(navigator.userAgent.toLowerCase().indexOf('safari')>=0)st=0; 
var leftPos = e.clientX - 100;
if(leftPos<0)leftPos = 0;
obj.style.left = leftPos + 'px';
obj.style.top = e.clientY - obj.offsetHeight -1 + st + 'px';
}
</script>在”新版学生系统</script>“处有一个</script>,导致用jsoup和htmlcleaner读出来都不对,没有匹配到最后面的</script>,求问怎么样处理这种代码才可以把这一整段都清除掉?JavaJavaScriptHTML