老手网

PHP中英文断句无乱码

分类:javascript 作者: 来源: 发布:2013-05-21 16:19:36
思路:  
1.将字符串用urlencode编码。  
2.用正则搜索以转码后的标点结尾的语句。 
3.urldecode解码数据

echo urlencode(',-.-?-!-;-,-。-?-!-;-......').PHP_EOL;
$str  = "开源中国,开源中国.开源中国?开源中国!开源中国;开源中国,开源中国。开源中国?开源中国!开源中国;开源中国......";
echo $str;
$str = urlencode($str);
preg_match_all ('/(.*?)(\.{3,6}|%2C|\.|%3F|%21|%3B|%EF%BC%8C|%E3%80%82|%EF%BC%9F|%EF%BC%81|%EF%BC%9B)/',$str,$matchs);
foreach($matchs[0] as $v){
	$newArr[] = urldecode($v);
}
var_dump($newArr);

 

-
分享到:

Copyright © 2012 - 2013 oldhand.cn All Rights Reserved. 粤ICP备13025864号