在最近的一个项目中,要生成文章的摘要。中间过程中有很多字符串处理过程,比如文件格式转换,编码转换、截断字符串等等。在这些操作中难免会产生异常的字符,比如将一个汉字截断成两个,或者其他情况产生了类似于乱码的字符,那么如何清理掉这些非法字符呢?我的程序是用的UTF-8编码,所有的内容也都是UTF-8编码格式。
解决方案 »
- php,,请教各位高手,,
- 缓冲模糊效果 ,哎 好象还是搞FLASH编程有意思,看着也舒服
- 什么时候php要是能开发像b/s那样的桌面程序就好了。
- openssl制作数字证书问题
- 为什么用PHPMYADMIN连接MYSQL就死掉?
- php和xml结合有什么好处?
- 请教一个问题?
- 关于在搜索结果中将关键字用红色文字表示,急?加100分
- $data=@mysql_fetch_array($sql);这句中 “@”什么意思???马上结
- 关于mac的yosemite系统下安装xmapp之后mysql无法启动的问题,望知道的兄弟能告知一下。
- form post 如何替换原来文本的值?
- 网站换了空间后,其他页面可以打开浏览,后台页面打不开了,怎么解决啊?在原先的空间中时是可以的。
截取部分是不可控的,由sphinx根据关键字生成的,doc转txt的时候也会产生一些异常字符的