$str = "我们的心中充满希望,我们热爱生活!我也庆喜来到这个世界。难道不是嘛?我";
$chars = preg_split("/\xa3[\xa1-\xaf\xba-\xc0\xdb-\xe0\xfb\xfe]|。/", $str, -1, PREG_SPLIT_NO_EMPTY);Array
(
[0] => 我们的心中充满希望
[1] => 我们热爱生活
[2] => 我也庆喜来到这个世界
[3] => 难道不是嘛
[4] => 我
)不过请注意,这样依然还是会出现乱码的,比如“生活”改为“生希活”时
因为preg函数组不是双字节可靠的!
$chars = preg_split("/\xa3[\xa1-\xaf\xba-\xc0\xdb-\xe0\xfb\xfe]|。/", $str, -1, PREG_SPLIT_NO_EMPTY);Array
(
[0] => 我们的心中充满希望
[1] => 我们热爱生活
[2] => 我也庆喜来到这个世界
[3] => 难道不是嘛
[4] => 我
)不过请注意,这样依然还是会出现乱码的,比如“生活”改为“生希活”时
因为preg函数组不是双字节可靠的!
$chars = preg_split("/(,|、|!|?|;|。)(?=([\x00-\xa0]|[\xa1-\xff]{2})*$)/", $str, -1, PREG_SPLIT_NO_EMPTY);