不管寫哪種程式,偶爾都會碰到要判斷是不是中文字
而基本上判斷的原理都是將文字轉成unicode
利用中文的unicode介於0x4E00~0x9FA5去做判斷
[Javascript]
function chineseCount(word) #計算中文字的數量
{
return word.split(/[\u4e00-\u9a05]/).length -1;
}
[PHP]
function chineseCount($word)
{
count( preg_split("/[\x{4e00}-\x{9a05}]/u",$word)
}
[Perl]
..........研究不出來,如果懂的人請寄信給我~__~
PS.以上都是在utf-8的編碼下,同時由於當初編碼的時候,繁體中文與簡體中文是混在一塊的
所以上面的方法會同時判斷繁簡中文,如果要分開印象中編碼的區段分成很多段
就要另外找一下編碼表了~~~
而基本上判斷的原理都是將文字轉成unicode
利用中文的unicode介於0x4E00~0x9FA5去做判斷
[Javascript]
function chineseCount(word) #計算中文字的數量
{
return word.split(/[\u4e00-\u9a05]/).length -1;
}
[PHP]
function chineseCount($word)
{
count( preg_split("/[\x{4e00}-\x{9a05}]/u",$word)
}
[Perl]
..........研究不出來,如果懂的人請寄信給我~__~
PS.以上都是在utf-8的編碼下,同時由於當初編碼的時候,繁體中文與簡體中文是混在一塊的
所以上面的方法會同時判斷繁簡中文,如果要分開印象中編碼的區段分成很多段
就要另外找一下編碼表了~~~