怎样获取一个网页中的文字内容? 例如,我现在有一个String 里面有这个网页的源文件,但是我要去掉那些代码阿标签阿,只要留下显示在浏览器中的文字。 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 自己写一个方法 把 '<' '>'之间的全部去掉就可以了 如果网页里面也有< >就不对了,是不是可以先取出<> 中的内容,如果后面有对应的</>才可以呢?看是否有更好的方法 我研究出来了 strPage = strPage.replaceAll("\\n*", ""); strPage = strPage .replaceAll( "<[sS]+[cC]+[rR]+[iI]+[pP]+[tT]+.+?>.+?</[sS]+[cC]+[rR]+[iI]+[pP]+[tT]+>", ""); strPage = strPage .replaceAll( "<[sS]+[tT]+[yY]+[lL]+[eE]+.+?>.+?</[sS]+[tT]+[yY]+[lL]+[eE]+>", ""); strPage = strPage.replaceAll("<.+?>", ""); strPage = strPage.replaceAll(" ", " "); strPage = strPage.replaceAll(">", " "); strPage = strPage.replaceAll(";", ""); strPage = strPage.replaceAll("\\s+", " ");效果还不错 有没有什么配置在调用一个类方法的同时调用另一个方法 关于JDBC! SWT的dnd.DragSource及DropTarget问题 新手请教,一些简单的问题!! 请各个高手给于帮助! 对面的高手看过来....! applet中如何实现进度条? 急!急!在线候救!!怎么实现form上传 如何实现选择一个文件夹? 保证送分,请进来看 谁能告诉我什么TOMCAT有什么用 请问JFreeChart怎么画曲线图? 求《Java 2 范例入门与提高》课件
strPage = strPage.replaceAll("\\n*", "");
strPage = strPage
.replaceAll(
"<[sS]+[cC]+[rR]+[iI]+[pP]+[tT]+.+?>.+?</[sS]+[cC]+[rR]+[iI]+[pP]+[tT]+>",
"");
strPage = strPage
.replaceAll(
"<[sS]+[tT]+[yY]+[lL]+[eE]+.+?>.+?</[sS]+[tT]+[yY]+[lL]+[eE]+>",
"");
strPage = strPage.replaceAll("<.+?>", "");
strPage = strPage.replaceAll(" ", " ");
strPage = strPage.replaceAll(">", " ");
strPage = strPage.replaceAll(";", "");
strPage = strPage.replaceAll("\\s+", " ");
效果还不错