為什麼'\x1B'.length===1？\x與\u知識延伸

粥裡有勺糖發表於2021-10-04

原文網址 : https://www.cnblogs.com/roseAT/p/15367644.html

背景

先講一下背景，再說原因

大多數庫都會在日誌中使用chalk庫為console的內容進行上色

被chalk處理後，其原本的內容會被‘\x1B...’所包裹

console.log(chalk.blue('green'));
console.log([chalk.blue('green')]);

在開發vite-plugin-monitor時，為了獲取原始的日誌內容（上色之前），需要將上色後的字串還原

\x1B[34mgreen\x1B[39m => green

在使用正則處理內容的時候發現了一個問題

'\x1B'.replace(/\\x/,'') // 結果？？

通過.length檢視其長度，結果就如標題所示

原因

反斜槓"\"通常標識轉義字元，如\n(換行符),\t(製表符)

而\x就標識16進位制，後面跟上兩位16進位制數

與此同時還有\u也是標識16進位制，但其後面需跟上4位16進位制數

因此這裡的\x1B實際上就是一個字元

'\x41' === 'A'   // true
'A' === '\u0041' // true

\x

\xhh匹配一個以兩位十六進位制數（\x00-\xFF）表示的字元

主要用於ASCII碼的表示

'\x41' === ‘A’
'A' === String.fromCharCode(65)

'\x61' === ‘a’
'a' === String.fromCharCode(97)

\x後必須跟著兩位16進位制的字元，否則會報錯，其中 A-F 不區分大小寫

'\x1' // Uncaught SyntaxError: Invalid hexadecimal escape sequence
'\xfg' // Uncaught SyntaxError: Invalid hexadecimal escape sequence

\u

\uhhhh匹配一個以四位十六進位制數（\u0000-\uFFFF）表示的 Unicode 字元。

在正規表示式中常見於匹配中文字元

const r = /[\u4e00-\u9fa5]/
r.test('中文') // true
r.test('English') // false

常規字元與Unicode字元互轉

str2Unicode

使用String.prototype.charCodeAt獲取指定位置的 Unicode 碼點（十進位制表示）
使用String.prototype.toString將其轉為十六進位制字元,轉為16進位制字元不會自動補0
通過String.prototype.padStart進行補0

編寫的通用處理方法如下

function str2Unicode(str) {
    let s = ''
    for (const c of str) {
        s += `\\u${c.charCodeAt(0).toString(16).padStart(4, '0')}`
    }
    return s
}

str2Unicode('1a中文') // '\\u0031\\u0061\\u4e2d\\u6587'

unicode2Str

通過正則/\\u[\da-f]{4}/g匹配出所有的unicode字元
使用Number將0x${matchStr}轉換為10進位制數
使用String.fromCodePoint將unicode碼點轉為字元
使用String.prototype.replace進行逐字元的轉換

function unicode2Str(str) {
    const unicodeList = str.match(/\\u[\da-f]{4}/g) || []
    return unicodeList.reduce((pre, u) => {
        return pre.replace(u, String.fromCodePoint(Number(`0x${u.slice(2)}`)))
    }, str)
}

unicode2Str('1\\u0061\\u4e2d文') // 1a中文

還原chalk處理後的字串

自己從0-1寫一個正則難免會有許多邊界情況考慮不周全，於是在chalk的README中找到了chalk/ansi-regex這個庫

可以將色值相關的 ANSI轉義碼 匹配出來

import ansiRegex from 'ansi-regex';

'\u001B[4mcake\u001B[0m'.match(ansiRegex());
//=> ['\u001B[4m', '\u001B[0m']

'\u001B[4mcake\u001B[0m'.match(ansiRegex({onlyFirst: true}));
//=> ['\u001B[4m']

編寫一下處理方法

function resetChalkStr(str) {
    return str.replace(ansiRegex(), '')
}

測試

console.log(chalk.green('green'), chalk.greenBright('greenBright'));

console.log([chalk.green('green'), chalk.greenBright('greenBright')]);

console.log(resetChalkStr(`${chalk.green('green')} ${chalk.greenBright('greenBright')}`));

總結

重拾了一下\x與\u相關的內容，突然額外想到一個點，使用\u去做字串的加解密(下來再捋一捋)

解決了一個chalk相關的問題“還原終端中的彩色內容”

【知識分享】伺服器中的u代表什麼
2022-12-08
伺服器
【知識分享】1U和2U的伺服器怎麼選擇
2022-12-30
伺服器
多域名解析及延伸知識點
2019-03-01
1U、2U、3U伺服器機櫃的尺寸知識大全
2022-02-23
伺服器
什麼是知識
2019-11-29
檔案許可權中 chmod、u+x、u、r、w、x分別代表什麼
2018-04-12
為什麼 HTTP PATCH 方法不是冪等的及其延伸
2019-04-06
HTTP
SpringMVC系列知識：（二）什麼是springMVC，為什麼要使用springMVC
2020-09-28
SpringMVC
瀏覽器中window.length的結果是什麼？為什麼？
2024-12-09
瀏覽器
知識庫終極指南：為什麼您的企業需要知識庫？
2023-11-01
【知識分享】伺服器為什麼要測壓需要注意什麼
2023-02-03
伺服器
【知識分享】香港伺服器的IPMI是什麼？為什麼需要它？
2023-02-20
伺服器
人工智慧（二、知識表示）——1.知識表示與知識表示的概念
2020-10-06
人工智慧
為什麼業務知識會嚴重影響建模效果？
2020-08-10
【知識分享】伺服器為什麼要使用防火牆
2023-02-03
伺服器防火牆
為什麼Vue不能觀察到陣列length的變化？
2019-03-01
Vue陣列
為什麼說session依賴cookie，以及cookie的常用知識
2019-02-16
SessionCookie
為什麼說保險業需要KGB知識圖譜加持
2019-12-03
【知識分享】為什麼linux系統伺服器病毒更少
2022-11-14
Linux伺服器
web前端需要掌握什麼知識？
2022-08-19
Web前端
為什麼要用where 1=1
2019-08-27
Spring Cloud 升級之路 - 2020.0.x - 1. 背景知識、需求描述與公共依賴
2021-04-04
SpringCloud
為什麼學人工智慧首推Python 需要學習哪些知識
2019-08-09
人工智慧Python
[SwiftUI 知識碎片] 為什麼 @State 只能在結構體中工作
2020-03-11
SwiftUI結構體
【知識分享】跨境業務為什麼選擇海外伺服器
2022-11-28
伺服器
伺服器託管1U是指什麼
2020-06-17
伺服器
1、基本知識
2024-02-27
研發知識：MDD、MDF是什麼？
2021-05-14
IOS基礎-設計UI@1X@2X@3X是什麼
2018-03-28
iOSUI
【Python小知識】什麼是HTTP和HTTPS？有什麼不同？
2022-07-18
PythonHTTP
【知識分享】伺服器cdn是什麼有什麼功能
2023-03-09
伺服器
【知識分享】代理伺服器是什麼有什麼用
2023-03-09
伺服器
【知識分享】asp伺服器是什麼有什麼用途
2023-02-10
伺服器
Visual Studio Code為什麼能這麼牛X？
2020-04-06
知識｜古人為什麼豎著從右向左寫字？原來如此！
2018-10-23
【知識分享】伺服器為什麼要託管在IDC機房
2022-11-16
伺服器
這絕對是你的知識盲點，NUMA的為什麼存在
2021-04-29
git push -u 中的u是什麼意思
2024-11-08
Git

為什麼'\x1B'.length===1？\x與\u知識延伸

背景

原因

\x

\u

常規字元與Unicode字元互轉

str2Unicode

unicode2Str

還原chalk處理後的字串

總結

相關文章