$string = preg_replace('/&((#(\d{3,5}|x[a-fA-F0-9]{4}));)/', '&\\1',
str_replace(array('&', '"', '<', '>'), array('&', '"', '<', '>'), $string));转义字符串中的特殊字符 '/&((#(\d{3,5}|x[a-fA-F0-9]{4}));)/', '&\\1', 这部分含义?
str_replace(array('&', '"', '<', '>'), array('&', '"', '<', '>'), $string));转义字符串中的特殊字符 '/&((#(\d{3,5}|x[a-fA-F0-9]{4}));)/', '&\\1', 这部分含义?
然后把&#nnnnn 或 &#xnnnn 换成 &#nnnnn\\1表示对第一个括号内的内容原样保留,就是((#(\d{3,5}|x[a-fA-F0-9]{4}))这部分
这个是DISCUZ 的过滤函数对吧。
其实这个函数的意识就是过滤 HTML字符串,但是那些已经被过滤了的,比如“'"”单引号双引号。“&”的实体是&那么像这样的就不过滤,保留,以防多次过滤。结果 &变成了&amp;
//取消HTML代码
function shtmlspecialchars($string) {
if(is_array($string)) {
foreach($string as $key => $val) {
$string[$key] = shtmlspecialchars($val);
}
} else{
$string = preg_replace('/&((#(\d{3,5}|x[a-fA-F0-9]{4})|[a-zA-Z][a-z0-9]{1,5});)/', '&\\1',
str_replace(array('&', '"', '<', '>','\''), array('&', '"', '<', '>','''), $string));
}
return $string;
}