關於 JavaScript 字串的一個小知識

李中凱發表於2020-08-14

原文網址 : https://www.cnblogs.com/lzkwin/p/13500492.html

說起字串，我們再熟悉不過了。接觸程式設計的第一個經典任務就是輸出字串：Hello, world。但是你知道 JavaScript 字串在計算機裡是怎麼表示的嗎？

最簡單直觀但不太準確的的理解就是，字串就是由英文字母、數字和標點符號等這些字元組成的序列。比如下面這個字串就是由5個字母和一個感嘆號組成的：

const message = 'Hello!';

同時也可以看出該字串的字元數是6：

const message = 'Hello!';
message.length; // => 6

如果字串是由這些可見字元（也就是 127 個 ASCII 字元）組成的，這樣理解沒有問題。但是，一旦碰到不常見的符號，比如一些表情字元?, ?, ?，可能會得到意外的結果：

const smile = '?';
smile.length; // => 2

是不是很奇怪？明明只有一個字元，長度怎麼會是 2 呢？這是因為，JavaScript 字串實際上是由編碼單元構成的，而不是可見字元序列。

ECMA 262 規範裡是這麼描述 JavaScript 字串的：

String 型別是由零或多個 16 位無符號整數值組成的有序序列的集合。字串型別通常用於表示執行中的 ECMAScript 程式中的文字資料，在這種情況下，字串中的每個元素都被視為 UTF-16 編碼單元值。

簡單說，JavaScript 字串就是 UTF-16 編碼單元序列，一串數字而已。

一個編碼單元就是位於 0x0000 和 0xFFFF 之間的一個數字，編碼單元與字元之間有個對應關係。例如，編碼單元 0x0048 對應了實際的字元 H：

const letter = '\u0048';
letter === 'H' // => true

如果把一整個字串'Hello!'用編碼單元表示就是這樣：

const message = '\u0048\u0065\u006C\u006C\u006F\u0021';
message === 'Hello!'; // => true
message.length;       // => 6

可以看到，這個字串有6個編碼單元，每個編碼單元對應一個字元。基本多文種平面 BMP(Basic Multilingual Plane)中的任意一個字元，都可以用一個 UTF-16 編碼單元表示。但是，在這個範圍以外的字元，就需要 2 個 UTF-16 編碼單元來表示了。比如前面提到的笑臉符號，編碼是\uD83D\uDE00：

const smile = '\uD83D\uDE00';
smile === '?'; // => true
smile.length;  // => 2

這兩個編碼單元是成對存在的，用於表示超出 0xFFFF 的字元。不能拆開，否則就變成無法識別的亂碼了。另外，這裡的.length是2，說明這個屬性其實是字串編碼單元的個數，而不是字元數。在需要判斷字元數量的時候就要注意了，根據.length得到的結果是不準確的。那要怎麼解決呢？可以用這種辦法：

const message = 'Hello!';
const smile = '?';

[...message].length; // => 6
[...smile].length;   // => 1

部落格園不常更新，更多前端技術乾貨可前往公眾號。

關於C++ scanf的一個小知識
2022-02-09
C++
關於range的一個知識點
2018-05-02
Python中關於Thread的一點小知識
2019-02-26
Pythonthread
關於前端應該知道的5個小知識
2018-06-16
前端
關於SQL優化的小知識
2019-02-19
SQL優化
JavaScript 有趣的冷知識：模板字串
2022-12-27
JavaScript字串
關於SAP ABAP字元變數和字串變數字元個數的一個知識點，和一個血案
2020-05-02
字元變數字串
那些關於Mac終端的小知識
2020-11-04
Mac
關於網校系統開發的小知識
2021-03-30
關於AP的一些知識點
2022-11-14
關於MySQL索引知識與小妙招 — 學到了！
2020-12-19
MySql索引
關於高水位的知識
2018-08-19
關於網頁的一些小知識點
2019-02-16
網頁
關於Async、Await的一些知識點
2023-10-04
AI
一些關於IO流的知識點
2024-06-26
關於animation和transition一點知識
2020-02-13
關於Python Number 相關的知識！
2019-04-26
Python
關於字串的功能函式小結
2024-05-25
字串函式
關於知識付費的思考
2023-02-05
一些關於網路的基礎知識
2018-07-01
總結關於CPU的一些基本知識
2019-07-06
十個關於網際網路圈的冷知識
2022-01-06
關於LLC知識1
2024-08-30
C++中一個名字查詢的小知識
2018-07-13
C++
關於Java的小知識集合之 ArrayList可變長陣列
2020-03-18
Java陣列
關於蘋果企業開發者賬號的小知識
2020-10-19
蘋果
如何快速掌握Javascript入門小知識
2022-10-19
JavaScript
一個關於JAVA GC的小實驗
2021-09-09
JavaGC
一個關於風險和投資組合的內部知識分享文件
2019-09-19
關於Python包和模組的10個知識清單
2018-09-26
Python
SEO關於探討URL的知識！
2020-08-07
關於索引必須知道的知識
2021-01-03
索引
關於 API介面的一些知識分享
2023-04-26
API
總結的小知識點（一）
2018-12-10
有關Es6知識的小結
2018-08-11
React相關知識點：關於Redux
2019-05-05
ReactRedux
前端小知識--從Javascript閉包看let
2018-03-19
前端JavaScript
關於高防伺服器的一些知識點
2019-09-06
伺服器

關於 JavaScript 字串的一個小知識

相關文章