var content = html.replace(/<([a-zA-Z1-6]+)(\s*[^>]*)?>/g, "<$1>");
用这个正则表达式虽然把样式都去了,但是把img的src也给去掉了,有没有大佬帮忙改一下,去掉所有的样式的时候不要把src也给去了

解决方案 »

  1.   

    没必要用正则吧。试试JQ的DOM把class属性去掉。或者创建新的IMG,只设置src属性
      

  2.   

    Whitelist whitelist=new Whitelist();  //通过设置白名单留下想要的html标签
            whitelist.addAttributes("p","<p>","</p>");
            String html = "<p><a href='http://www.baidu/' onclick='stealCookies()'> 百度一下,你就知道 </a></p>";
            String doc = Jsoup.clean(html,whitelist);