老手网

判断一个字符串是否为utf-8的编码

分类:PHP 作者:oldhand 来源: 发布:2013-05-25 21:37:23
同样的一个svn目录,
在windows平台是gb2312编码
在linux下同步后,竟然是utf-8的编码

这样,我们在路径判断上就需要更多的判断了,
使用操作系统的判断方法显得并不通用。
直接判断是否为utf-8的编码,然后再决定是否需要转码,显得更为直接一些。

function seems_utf8($str) 
{
	$length = strlen($str);  
	for ($i=0; $i < $length; $i++) 
	{
		$c = ord($str[$i]);
		if ($c < 0x80) $n = 0; # 0bbbbbbb
		elseif (($c & 0xE0) == 0xC0) $n=1; # 110bbbbb
		elseif (($c & 0xF0) == 0xE0) $n=2; # 1110bbbb
		elseif (($c & 0xF8) == 0xF0) $n=3; # 11110bbb
		elseif (($c & 0xFC) == 0xF8) $n=4; # 111110bb
		elseif (($c & 0xFE) == 0xFC) $n=5; # 1111110b
		else return false; # Does not match any model
		for ($j=0; $j<$n; $j++) 
		{ 
			if ((++$i == $length) || ((ord($str[$i]) & 0xC0) != 0x80))
			return false;
		}
	}
	return true;
}

 

-
分享到:

Copyright © 2012 - 2014 oldhand.cn All Rights Reserved. 粤ICP备13025864号