怎么去掉html代码啊 从数据库里读出一段数据例如:<font color=#00000>Hello</font>怎么用java程序去掉所有的html代码,只显示Hello,小第先谢了啊! 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 package edu.cust.test;import java.util.regex.Matcher;import java.util.regex.Pattern;public class HtmlFliter { private Pattern p; private Matcher m; public String htmlChanger(String regEx, String htmlTag, String replaceStr) { String ret = ""; try { p = Pattern.compile(regEx);// 设置比较模式 m = p.matcher(htmlTag); boolean rs = m.find(); ret = p.matcher(htmlTag).replaceAll(replaceStr); } catch (Exception e) { } return ret; } public static void main(String[] args) { String htmlToChange = "<font color=#00000>Hello</font>";//你要转换的HTML标记。 String yourRegEx = "(<\\s*[a-zA-Z][^>]*>)|(</\\s*[a-zA-Z][^>]*>)";//这个就是对应的去掉HTML标记的正则表达式 String replaceStr = "";//这个是你要将它替换的字符串,因为你要消去HTML标记,所以这里用空串。 HtmlFliter fliter = new HtmlFliter(); String result = fliter.htmlChanger(yourRegEx, htmlToChange, replaceStr); System.out.println("---->: " + result); }} 当然如果去掉<style></style><script></script>也许有些不好用。试试下面的正则表达式。(<\\s*script\\s*>\\s*([a-zA-Z])*\\s*|([\\u4e00-\\u9fa5])*|([^\\x00-\\xff])*</\\s*script\\s*>)(<\\s*style\\s*>)\\s*([a-zA-Z])*\\s*|([\\u4e00-\\u9fa5])*|([^\\x00-\\xff])*(</\\s*style\\s*>) java web项目中如何处理大数据量 JSP注册页面、表单中 文本对应的按钮点击传递文本值 谁知道我这个jsp页面的问题出在哪儿呀? 在启动Tomcat的时候遇到的问题! 又是java.lang.NullPointerException 大家都是如何查找jsp的帮助的? spring的问题,好郁闷啊,在线等 @ManyToMany 页面怎样实现联动效果 select count(id) as bb from notehead,这句在查询分析器里是能执行的,可 sonatype nexus问题。。求助 想把表中的数据显示出来 一个同时把上传图片和其他字段同时写入数据库的问题!
import java.util.regex.Pattern;public class HtmlFliter { private Pattern p; private Matcher m; public String htmlChanger(String regEx, String htmlTag, String replaceStr) { String ret = "";
try {
p = Pattern.compile(regEx);// 设置比较模式
m = p.matcher(htmlTag);
boolean rs = m.find();
ret = p.matcher(htmlTag).replaceAll(replaceStr); } catch (Exception e) {
} return ret;
} public static void main(String[] args) { String htmlToChange = "<font color=#00000>Hello</font>";//你要转换的HTML标记。 String yourRegEx = "(<\\s*[a-zA-Z][^>]*>)|(</\\s*[a-zA-Z][^>]*>)";//这个就是对应的去掉HTML标记的正则表达式 String replaceStr = "";//这个是你要将它替换的字符串,因为你要消去HTML标记,所以这里用空串。 HtmlFliter fliter = new HtmlFliter();
String result = fliter.htmlChanger(yourRegEx, htmlToChange, replaceStr); System.out.println("---->: " + result); }
}
<script></script>也许有些不好用。
试试下面的正则表达式。
(<\\s*script\\s*>\\s*([a-zA-Z])*\\s*|([\\u4e00-\\u9fa5])*|([^\\x00-\\xff])*</\\s*script\\s*>)(<\\s*style\\s*>)\\s*([a-zA-Z])*\\s*|([\\u4e00-\\u9fa5])*|([^\\x00-\\xff])*(</\\s*style\\s*>)