小弟现在开发一个博客,
对于一篇客户发表的文章,可能是他从其他网站直接粘贴过来的,里面包含html代码,超链接,图片,空格等,
而在预览时就像新浪那样,只要显示一部分,
如果在500字以内,就截取到500字内的那最后一个段落,如果超过500字就截取到500字那止。
如果500字那里的那一字正好有样式,比如 <span class="kkk">俩</span>,
正好500字到kkk那,后面的字怎么截取,那么样式也成不规则的了。
如果其中某些文字包含超链接,就去掉超链接,
不规则的hmtl代码样式去掉,而规则的留着,
如果500字那里正好是一张图片,一张图片比如代码是<img src="pic.jpg" width=500 heigth="500">
如果500字那正好是在width那怎么办,怎不能把后面的不要?那图片也成不规则的了。
小弟对里面的实现原理不是很理解,有理解不对的地方,望请指正,
知道的大侠,请告诉我是怎么实现的,小弟在此感谢了。