跳转到内容


Javascript 计算中文英文字符串长度, count string length by javascript

Javascript 计算 字符串 长度 中文

  • 您无法回复此主题
No replies to this topic

#1 冰力

    Administrator

  • 总版主
  • 1316 帖子数:

发表于 2012/01/31 23:47:01

介紹將字串轉換為Byte 計算長度:

"測試".length;
// output : 2;

"ab".length;
// output : 2;


這樣子的結果似乎不是我們要得,所以我們決定轉換另一個方向,將所有字元長度都先轉換為byte code,之後再計算字元長度。

encodeURIComponent("測試");
// output "%E6%B8%AC%E8%A9%A6"

encodeURIComponent("ab");
// output "ab"


轉換成 byte之後,感覺上就可以開始計算了,一個中文可以切成3個byte,1個byte會呈現%dd,就可以計算成一個中文字,將上面得到的字串長度再除3就可以得知目前字長度。

var str = encodeURIComponent("測試");
console.log(str.length /3);
// output 6


乍看之下的確如此,但是中英文的情況會是如何!?
剛剛的結果很明顯長度為6,如果在中間穿插3個英文,會是什麼狀況?

var str = encodeURIComponent("a測b試c");
console.log(str.length /3);
[b]// output: 7[/b]
[b]// expect output: 6 + 3[/b]


實際輸出結果會是7,不,這並不是我們想要的答案。既然知道byte code結構為%dd,那我們就使用正規表示法,將需要的字元做取代,這樣所取得的字串長度就是實際需要的長度了。

replace(/%[A-F\d]{2}/g, 'U')


接著拿剛才的實際狀況來測試,沒錯真的是我們所需要的結果,太好啦,大功告成。

var str = encodeURIComponent("測試");
str = str.replace(/%[A-F\d]{2}/g, 'U').length;
console.log(str);
[b]// output: 6[/b]

var str = encodeURIComponent("a測b試c");
str = str.replace(/%[A-F\d]{2}/g, 'U').length;
console.log(str);
[b]// output: 9[/b]