import org.htmlparser.Parser;
import org.htmlparser.visitors.TextExtractingVisitor;
public static void main(String[] args) throws Exception 
{
Parser parser = new Parser("http://2008.sohu.com/20060210/n241768433.shtml");
TextExtractingVisitor visitor = new TextExtractingVisitor();
parser.visitAllNodesWith(visitor);
System.out.println(visitor.getExtractedText().trim());
}
运行结果里还有我不需要的东西,如:
td,input,select {font-size:12px;color:#000000;}.ui_top{color:#000000;font-size:12px;line-height:18px;}
.ui_top a:link{color:#000000;text-decoration:none;}
.ui_top a:visited{color:#000000;text-decoration:none;}
.ui_top a:hover {color:#000000;text-decoration:underline;}
a.link,a.:visited {color: #0071AE;text-decoration:none;line-height:18px;}
a.:hover{text-decoration:underline;}
var clickCount = 0;
function clearCommentContent(oObject) {
clickCount++;
if (clickCount == 1) {
oObject.value = "";
}
}
function checkCommentContent(oObject) {
if (clickCount == 0)
alert("请先填写您的个人看法");
else if(checkInput() != false)
oObject.form.submit();
}
请问这是为什么?