想必大家都知道字数分页之前在网上找了一个,可是发现有弊端就是如果内容中存在html代码也会被截断,怎么样来避免这种情况?我想过检索内容中的"<"和">"是否是成对出现,可以后来又发现还有问题就是说在数据库中存的是"&alt;"和"&nbsp;"之类的的代码又如何解决,还有就是用闭合标签时前后两个标签分开了又如何解决
<table style="font-size:12px;"><tr><td>
<p>女老师竭力向孩子们证明,学习好功课的重要性。&nbsp; &nbsp; &nbsp; &nbsp; &nbsp;  </p><p>她说:“牛顿坐在树下,眼睛盯着树在思考,这时,有一个苹果落在他的头上,于是他发现了万有引力定律,孩子们,你们想想看,做一位伟大的科学家多么好,多么神气啊,要想做到这一点,就必须好好学习。” &nbsp; &nbsp;   </p><p>“班上一个调皮鬼对此并不满意。他说:“兴许是这样,可是,假如他坐在学校里,埋头书本,那他就什么也发现不了啦。”   </p><p>女老师竭力向孩子们证明,学习好功课的重要性。 &nbsp; &nbsp;   </p><p>&nbsp; &nbsp; 她说:“牛顿坐在树下,眼睛盯着树在思考,这时,有一个苹果落在他的头上,于是他发现了万有引力定律,孩子们,你们想想看,做一位伟大的科学家多么好,多么神气啊,要想做到这一点,就必须好好学习。”   &nbsp; &nbsp; </p><p>“班上一个调皮鬼对此并不满意。他说:“兴许是这样,可是,假如他坐在学校里,埋头书本,那他就什么也发现不了啦。”   </p><p>女老师竭力向孩子们证明,学习好功课的重要性。  &nbsp; &nbsp;  </p><p>&nbsp; &nbsp; 她说:“牛顿坐在树下,眼睛盯着树在思考,这时,有一个苹果落在他的头上,于是他发现了万有引力定律,孩子们,你们想想看,做一位伟大的科学家多么好,多么神气啊,要想做到这一点,就必须好好学习。”   </p><p>“班上一个调皮鬼对此并不满意。他说:“兴许是这样,可是,假如他坐在学校里,埋头书本,那他就什么也发现不了啦。”   </p><p>女老师竭力向孩子们证明,学习好功课的重要性。   </p><p>她说:“牛顿坐在树下,眼睛盯着树在思考,这时,有一个苹果落在他的头上,于是他发现了万有引力定律,孩子们,你们想想看,做一位伟大的科学家多么好,多么神气啊,要想做到这一点,就必须好好学习。”  &nbsp; &nbsp;  </p><p>“班上一个调皮鬼对此并不满意。他说:“兴许是这样,可是,假如他坐在学校里,埋头书本,那他就什么也发现不了啦。”&nbsp; &nbsp;    </p><p>女老师竭力向孩子们证明,学习好功课的重要性。   </p><p>她说:“牛顿坐在树下,眼睛盯着树在思考,这时,有一个苹果落在他的头上,于是他发现了万有引力定律,孩子们,你们想想看,做一位伟大的科学家多么好,多么神气啊,要想做到这一点,就必须好好学习。”   </p><p>“班上一个调皮鬼对此并不满意。他说:“兴许是这样,可是,假如他坐在学校里,埋头书本,那他就什么也发现不了啦。”   </p></td></tr></table>有谁有好的方法拿出来分享一下(想考滤一下速度效率)

解决方案 »

  1.   

    去掉所有的html标记。适当的地方自己新兴标记。比如说换行之类的。然后去的当夜的内容。最好以段落的方式获取。(就是获取离分页位置最近的换行)
    分页位置记录。
    分页开始。
    分页结束~咱真YD,就没有些代码……
      

  2.   

    去掉html代码就达不到想要的样式需求了那我问的就没意义了
      

  3.   


    k可以达到所需。不过得进行转换第一种方案就是去掉比如郭TABLE之乐影响页面效果的标记。第二种方案是先按照类型转换标记,删除不需要的比较比,再抓换成可以使用的标记实际上还有第三种方案,就是把现实的内容包含在一个iframe或者DIV中。只要属性折腾的对,应该可以达到要求。不过实现起来难度并不小,请慎重使用。(frame可以使用js的写进去。DIV就不好说了,因为table标记还是会影响页面的。除非扯了这个标记之外,这个页面没有其他的table标记鸟~
      

  4.   

    能满足我的要求吗?自动分页,不截断html闭合标签和&nbsp;字符