小弟现在开发一个博客, 
对于一篇客户发表的文章,可能是他从其他网站直接粘贴过来的,里面包含html代码,超链接,图片,空格等, 
而在预览时就像新浪那样,只要显示一部分, 
如果在500字以内,就截取到500字内的那最后一个段落,如果超过500字就截取到500字那止。 
如果500字那里的那一字正好有样式,比如 <span class="kkk">俩 </span>, 
正好500字到kkk那,后面的字怎么截取,那么样式也成不规则的了。 
如果其中某些文字包含超链接,就去掉超链接, 
不规则的hmtl代码样式去掉,而规则的留着, 
如果500字那里正好是一张图片,一张图片比如代码是 <img src="pic.jpg" width=500 heigth="500"> 
如果500字那正好是在width那怎么办,怎不能把后面的不要?那图片也成不规则的了。 
小弟对里面的实现原理不是很理解,有理解不对的地方,望请指正, 
知道的大侠,请告诉我是怎么实现的,小弟在此感谢了。