请问 如何用htmlparser提取html中的文本呢? 我看到里面有StringExtractor但是不知道怎么用htmlparser里面的例子偶找不到各位仁兄帮忙拉 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 import org.htmlparser.Node;import org.htmlparser.NodeFilter;import org.htmlparser.Parser;import org.htmlparser.util.NodeList;public class HtmlUtils { public static String extractText(String inputHtml) throws Exception{ StringBuffer text = new StringBuffer(); Parser parser = Parser.createParser(new String(inputHtml.getBytes(),"8859_1")); //遍历所有的节点 NodeList nodes = parser.extractAllNodesThatMatch(new NodeFilter(){ public boolean accept(Node node) { return true; }}); Node node = nodes.elementAt(0); text.append(new String(node.toPlainTextString().getBytes("8859_1"))); return text.toString(); } public static void main(String[] args) throws Exception{ String text = extractText("<td>点击<b><a href=index.jsp>这里</a></b>回到首页</td>"); System.out.println(text); }} http://www-900.ibm.com/developerWorks/cn/java/l-html-parser/ 【请教】关于换工作直接走人的问题 请教关于java类间调用的问题 彩信收发问题 我如何能用visibroker 6.5中的ORB类呢?而不是用 org.omg.CORBA.ORB 的ORB类 在eslipce中 四子连珠fyrad32游戏的有关问题 关于JTree...如何使得树的节点存储的是自己的类,而节点显示的名字是类的属性?? 各位大狭,小弟跪求一些考试复习经验和心得,拜托各位多多帮忙 我是新手 关于io的拷贝文件问题 新手上路:两字符串相等的问题 一个按钮事件的问题,求人帮忙 java如何将文本转换成xml呢??
import org.htmlparser.NodeFilter;
import org.htmlparser.Parser;
import org.htmlparser.util.NodeList;
public class HtmlUtils {
public static String extractText(String inputHtml) throws Exception{
StringBuffer text = new StringBuffer();
Parser parser = Parser.createParser(new String(inputHtml.getBytes(),"8859_1"));
//遍历所有的节点
NodeList nodes = parser.extractAllNodesThatMatch(new NodeFilter(){
public boolean accept(Node node) {
return true;
}});
Node node = nodes.elementAt(0);
text.append(new String(node.toPlainTextString().getBytes("8859_1")));
return text.toString();
}
public static void main(String[] args) throws Exception{
String text = extractText("<td>点击<b><a href=index.jsp>这里</a></b>回到首页</td>");
System.out.println(text);
}
}