例子:
<p>  邻居去市场附近拍快照的亭子拍半身照。<br />
<pre id="content-580354917" class="reply-text mb10">
有个人一天碰到上帝.. 
<p>
上帝GOD突然大发善心打算给那人一个愿望&hellip;. 上帝问&hellip; 
<br/>
你有什么愿望吗&hellip; 
那个人想了想&hellip; 听说猫都有9条命&hellip; 那请您赐给我9条命吧.. 
</pre>

需要的结果:
邻居去市场附近拍快照的亭子拍半身照。有个人一天碰到上帝GOD..上帝突然大发善心打算给那人一个愿望上帝问你有什么愿望吗听说猫都有9条命

解决方案 »

  1.   

    依照你现有提示的代码,一个比较简单的正则就是
    <(.)+?>
    把符合上面的正则内容全部替换掉就行了。
      

  2.   

    text.replace("&hellip;","\u2026").replaceAll("<.+?>","").replaceAll("\\s+","")"  邻居去市场附近拍快照的亭子拍半身照。有个人一天碰到上帝..上帝GOD突然大发善心打算给那人一个愿望….上帝问…你有什么愿望吗…那个人想了想…听说猫都有9条命…那请您赐给我9条命吧.."
      

  3.   

    \s  A whitespace character: [ \t\n\x0B\f\r]
      

  4.   

    最简易的方法,楼主把HTML保存为.html,在浏览器中打开,就没有标签了,复制出来的全是纯文本。也可以保存在html中,写几个js,每个标签的innerText都是取此标签间的纯文本。
      

  5.   


    汗~我是要在java里面过滤啊~~55
      

  6.   

    \t是制表符,对应按下tab键的符号
    \r回车,光标移到下一行
    \n换行,光标跳到行首
    \f忘了
      

  7.   

    我测试过,没问题 String str = 
    "<p>  邻居去市场附近拍快照的亭子拍半身照。<br />"+
    "<pre id=\"content-580354917\" class=\"reply-text mb10\">"+
    "有个人一天碰到上帝.. "+
    "<p>"+
    "上帝GOD突然大发善心打算给那人一个愿望&hellip;. "+
    ""+
    "上帝问&hellip; "+
    "<br/>"+
    "你有什么愿望吗&hellip; "+
    "那个人想了想&hellip; "+
    ""+
    "听说猫都有9条命&hellip; "+ "那请您赐给我9条命吧.. "+
    "</pre>";
    str = str.replaceAll("<[^>]+>", "");
    str = str.replaceAll("\\s*", "");
    str = str.replaceAll("&[^&^;]+;", "");
    System.out.println(str);