JavaScript正規表示式 手冊

_王驍凱發表於2019-10-10

正規表示式

regular expression:RegExp

用來處理字串的規則

  • 只能處理字串
  • 它是一個規則:可以驗證字串是否符合某個規則(test),也可以把字串中符合規則的內容捕獲到(exec / match...)
let str = "good good study , day day up!";
//=>學正則就是用來制定規則(是否包含數字)
let reg = /\d+/;
reg.test(str); //=>false

str = "2019-08-12";
reg.exec(str); //=>["2019",index:0,inputs:"原始字串"]
複製程式碼

編寫正規表示式

建立方式有兩種

//=>字面量建立方式(兩個斜槓之間包起來的,都是用來描述規則的元字元)
let reg1 = /\d+/;

//=>建構函式模式建立  兩個引數:元字元字串,修飾符字串
let reg2 = new RegExp("\\d+");
複製程式碼

正規表示式由兩部分組成

  • 元字元
  • 修飾符
/*常用的元字元*/
//=>1.量詞元字元:設定出現的次數
* 零到多次  
+ 一到多次
? 零次或者一次
{n} 出現n次
{n,} 出現n到多次
{n,m} 出現n到m次

//=>2.特殊元字元:單個或者組合在一起代表特殊的含義
\    轉義字元(普通->特殊->普通)
.    除\n(換行符)以外的任意字元
^    以哪一個元字元作為開始
$    以哪一個元字元作為結束
\n   換行符
\d   0~9之間的一個數字
\D   非0~9之間的一個數字 (大寫和小寫的意思是相反的)
\w   數字、字母、下劃線中的任意一個字元
\s   一個空白字元(包含空格、製表符、換頁符等)
\t   一個製表符(一個TAB鍵:四個空格)
\b   匹配一個單詞的邊界
x|y  x或者y中的一個字元
[xyz] x或者y或者z中的一個字元
[^xy] 除了x/y以外的任意字元
[a-z] 指定a-z這個範圍中的任意字元  [0-9a-zA-Z_]===\w
[^a-z] 上一個的取反“非”
()   正則中的分組符號
(?:) 只匹配不捕獲
(?=) 正向預查
(?!) 負向預查 

//=>3.普通元字元:代表本身含義的
/zhufeng/ 此正則匹配的就是 "zhufeng"
複製程式碼
/*正規表示式常用的修飾符:img*/
i =>ignoreCase  忽略單詞大小寫匹配
m =>multiline   可以進行多行匹配
g =>global      全域性匹配

/* 
/A/.test('lalala')  =>false
/A/i.test('lalala') =>true
*/
複製程式碼

元字元詳細解析

^ $

let reg = /^\d/;
console.log(reg.test("zhufeng")); //=>false
console.log(reg.test("2019zhufeng"));//=>true
console.log(reg.test("zhufeng2019"));//=>false
複製程式碼
let reg = /\d$/;
console.log(reg.test("zhufeng")); //=>false
console.log(reg.test("2019zhufeng"));//=>false
console.log(reg.test("zhufeng2019"));//=>true
複製程式碼
//=>^/$兩個都不加:字串中包含符合規則的內容即可
let reg1 = /\d+/;
//=>^/$兩個都加:字串只能是和規則一致的內容
let reg2 = /^\d+$/;

//=>舉個例子:驗證手機號碼(11位,第一個數字是1即可)
let reg = /^1\d{10}$/;
複製程式碼

\

//=>.不是小數點,是除\n外的任意字元
let reg = /^2.3$/;
console.log(reg.test("2.3"));//=>true
console.log(reg.test("2@3"));//=>true
console.log(reg.test("23"));//=>false

//=>基於轉義字元,讓其只能代表小數點
reg = /^2\.3$/;
console.log(reg.test("2.3"));//=>true
console.log(reg.test("2@3"));//=>false

let str = "\\d";
reg = /^\d$/; //=>\d代表0-9的數字
console.log(reg.test(str)); //=>false
reg = /^\\d$/; //=>把特殊符合轉換為普通的
console.log(reg.test(str)); //=>true
複製程式碼

x|y

let reg = /^18|29$/;
console.log(reg.test("18")); //=>true
console.log(reg.test("29")); //=>true
console.log(reg.test("129")); //=>true
console.log(reg.test("189")); //=>true
console.log(reg.test("1829")); //=>true
console.log(reg.test("829")); //=>true
console.log(reg.test("182")); //=>true
//---直接x|y會存在很亂的優先順序問題,一般我們寫的時候都伴隨著小括號進行分組,因為小括號改變處理的優先順序 =>小括號:分組
reg = /^(18|29)$/;
console.log(reg.test("18")); //=>true
console.log(reg.test("29")); //=>true
console.log(reg.test("129")); //=>false
console.log(reg.test("189")); //=>false
//=>只能是18或者29中的一個了
複製程式碼

[]

//1.中括號中出現的字元一般都代表本身的含義
let reg = /^[@+]$/;
console.log(reg.test("@")); //=>true
console.log(reg.test("+")); //=>true
console.log(reg.test("@@")); //=>false
console.log(reg.test("@+")); //=>false

reg = /^[\d]$/; //=>\d在中括號中還是0-9
console.log(reg.test("d"));//=>false
console.log(reg.test("\\"));//=>false
console.log(reg.test("9"));//=>true

//2.中括號中不存在多位數
reg = /^[18]$/;
console.log(reg.test("1")); //=>true
console.log(reg.test("8")); //=>true
console.log(reg.test("18")); //=>false

reg = /^[10-29]$/; //=>1或者0-2或者9
console.log(reg.test("1"));//=>true
console.log(reg.test("9"));//=>true
console.log(reg.test("0"));//=>true
console.log(reg.test("2"));//=>true
console.log(reg.test("10"));//=>false
複製程式碼

常用的正規表示式

  1. 驗證是否為有效數字

    /*
     * 規則分析
     * 1.可能出現 + - 號,也可能不出現  [+-]?
     * 2.一位0-9都可以,多位首位不能是0 (\d|([1-9]\d+))
     * 3.小數部分可能有可能沒有,一旦有後面必須有小數點+數字 (\.\d+)?
     */
    let reg = /^[+-]?(\d|([1-9]\d+))(\.\d+)?$/;
    複製程式碼
  2. 驗證密碼

    //=>數字、字母、下劃線
    //=>6~16位
    let val = userPassInp.value,
        reg = /^\w{6,16}$/;
    let flag=reg.test(val);
    /*
    function checkPass(val){
        if(val.length<6 || val.length>16){
        	alert('長度必須介於6-16位之間!');
        	return;
    	}
        let area=['a','b'....'_']; //=>包含數字、字母、下劃線
        for(let i=0;i<val.length;i++){
            let char=val[i];
            if(!area.includes(char)){
                alert('格式不正確!');
        		return;
            }
        }
    }
    */
    複製程式碼
  3. 驗證真實姓名的

    /*
     * 1.漢字  /^[\u4E00-\u9FA5]$/
     * 2.名字長度 2~10位
     * 3.可能有譯名 ·漢字  (·[\u4E00-\u9FA5]{2,10}){0,2}
     */
    let reg = /^[\u4E00-\u9FA5]{2,10}(·[\u4E00-\u9FA5]{2,10}){0,2}$/;
    複製程式碼
  4. 驗證郵箱的

    let reg = /^\w+((-\w+)|(\.\w+))*@[A-Za-z0-9]+((\.|-)[A-Za-z0-9]+)*\.[A-Za-z0-9]+$/;
    
    //=> \w+((-\w+)|(\.\w+))*
    //1.開頭是數字字母下劃線(1到多位)
    //2.還可以是 -數字字母下劃線 或者 .數字字母下劃線,整體零到多次
    //=>郵箱的名字由“數字、字母、下劃線、-、.”幾部分組成,但是-/.不能連續出現也不能作為開始
    
    //=> @[A-Za-z0-9]+
    //1.@後面緊跟著:數字、字母 (1-多位)
    
    //=> ((\.|-)[A-Za-z0-9]+)*
    //1.對@後面名字的補充
    // 多域名     .com.cn
    // 企業郵箱    zxt@zhufeng-peixun-office.com
    
    //=> \.[A-Za-z0-9]+
    //1. 這個匹配的是最後的域名(.com/.cn/.org/.edu/.net...)
    複製程式碼
  5. 身份證號碼

    /*
     * 1. 一共18位
     * 2. 最後一位可能是X
     *
     * 身份證前六位:省市縣  130828
     * 中間八位:年月日
     * 最後四位:
     *   最後一位 => X或者數字
     *   倒數第二位 => 偶數 女  奇數 男
     *   其餘的是經過演算法算出來的
     */
    //let reg = /^\d{17}(\d|X)$/;
    //=>小括號分組的第二個作用:分組捕獲,不僅可以把大正則匹配的資訊捕獲到,還可以單獨捕獲到每個小分組的內容
    let reg = /^(\d{6})(\d{4})(\d{2})(\d{2})\d{2}(\d)(\d|X)$/;
    reg.exec("130828199012040617"); //=>["130828199012040617", "130828", "1990", "12", "04", "1", "7"...] 捕獲結果是陣列,包含每一個小分組單獨獲取的內容
    複製程式碼

正則兩種建立方式的區別

//=>建構函式因為傳遞的是字串,\需要寫兩個才代表斜槓
let reg = /\d+/g;
reg = new RegExp("\\d+","g");

//=>正則表達是中的部分內容是變數儲存的值
//1.兩個斜槓中間包起來的都是元字元(如果正則中要包含某個變數的值,則不能使用字面量方式建立)
let type = "zhufeng";
reg = /^@"+type+"@$/; 
console.log(reg.test("@zhufeng@")); //=>false
console.log(reg.test('@"""typeeeee"@')); //=>true
//2.這種情況只能使用建構函式方式(因為它傳遞的規則是字串,只有這樣才能進行字串拼接)
reg = new RegExp("^@"+type+"@$");
console.log(reg.test("@zhufeng@"));//=>true
複製程式碼

正則的捕獲

實現正則捕獲的辦法

  • 正則RegExp.prototype上的方法

    • exec
    • test
  • 字串String.prototype上支援正規表示式處理的方法

    • replace
    • match
    • splite
    • .......
let str = "zhufeng2019yangfan2020qihang2021";
let reg = /\d+/;
/*
 * 基於exec實現正則的捕獲
 *   1.捕獲到的結果是null或者一個陣列
 *     第一項:本次捕獲到的內容
 *     其餘項:對應小分組本次單獨捕獲的內容
 *     index:當前捕獲內容在字串中的起始索引
 *     input:原始字串
 *   2.每執行一次exec,只能捕獲到一個符合正則規則的,但是預設情況下,我們執行一百遍,獲取的結果永遠都是第一個匹配到的,其餘的捕獲不到
 *     =>“正則捕獲的懶惰性”:預設只捕獲第一個
 */
console.log(reg.exec(str)); //=>["2019", index: 7, input: "zhufeng2019yangfan2020qihang2021"]
console.log(reg.exec(str)); //=>["2019"...]

/*
//=>實現正則捕獲的前提是:當前正則要和字串匹配,如果不匹配捕獲的結果是null
let reg = /^\d+$/;
console.log(reg.test(str)); //=>false
console.log(reg.exec(str)); //=>null
*/
複製程式碼

懶惰性的解決辦法

let str = "zhufeng2019yangfan2020qihang2021";
/*
 * reg.lastIndex:當前正則下一次匹配的起始索引位置 
 *   懶惰性捕獲的原因:預設情況下lastIndex的值不會被修改,每一次都是從字串開始位置查詢,所以找到的永遠只是第一個
 *   解決辦法:全域性修飾符g
 */
// let reg = /\d+/;
// console.log(reg.lastIndex); //=>0 下面匹配捕獲是從STR索引零的位置開始找
// console.log(reg.exec(str));
// console.log(reg.lastIndex); //=>0 第一次匹配捕獲完成,lastIndex沒有改變,所以下一次exec依然是從字串最開始找,找到的永遠是第一個匹配到的

// let reg = /\d+/g;
// console.log(reg.exec(str)); //=>["2019"...]
// console.log(reg.lastIndex); //=>11 設定全域性匹配修飾符g後,第一次匹配完,lastIndex會自己修改
// console.log(reg.exec(str)); //=>["2020"...]
// console.log(reg.lastIndex); //=>22
// console.log(reg.exec(str)); //=>["2021"...]
// console.log(reg.lastIndex); //=>32
// console.log(reg.exec(str)); //=>null 當全部捕獲後,再次捕獲的結果是null,但是lastIndex又迴歸了初始值零,再次捕獲又從第一個開始了...
// console.log(reg.lastIndex); //=>0
// console.log(reg.exec(str)); //=>["2019"...]

// let reg = /\d+/g;
// if (reg.test(str)) {
// 	//=>驗證一下:只有正則和字串匹配我們在捕獲
// 	console.log(reg.lastIndex); //=>11 基於TEST匹配驗證後,LASTINDEX已經被修改為第一次匹配後的結果,所以下一次捕獲不再從頭開始了
// 	console.log(reg.exec(str)); //=>["2020"...]
// }

//=>需求:編寫一個方法execAll,執行一次可以把所有匹配的結果捕獲到(前提正則一定要設定全域性修飾符g)
~ function () {
    function execAll(str = "") {
        //=>str:要匹配的字串
        //=>this:RegExp的例項(當前操作的正則)
        //=>進來後的第一件事,是驗證當前正則是否設定了G,不設定則不能在進行迴圈捕獲了,否則會導致死迴圈
        if (!this.global) return this.exec(str);
        //=>ARY儲存最後所有捕獲的資訊  RES儲存每一次捕獲的內容(陣列)
        let ary = [],
            res = this.exec(str);
        while (res) {
            //=>把每一次捕獲的內容RES[0]存放到陣列中
            ary.push(res[0]);
            //=>只要捕獲的內容不為NULL,則繼續捕獲下去
            res = this.exec(str);
        }
        return ary.length === 0 ? null : ary;
    }
    RegExp.prototype.execAll = execAll;
}();

let reg = /\d+/g;
console.log(reg.execAll("珠峰2019@2020培訓"));
//=>字串中的MATCH方法,可以在執行一次的情況下,捕獲到所有匹配的資料(前提:正則也得設定G才可以)
console.log("珠峰2019@2020培訓".match(reg));
複製程式碼

正則的分組捕獲

//=>身份證號碼
let str = "130828199012040112";
let reg = /^(\d{6})(\d{4})(\d{2})(\d{2})\d{2}(\d)(?:\d|X)$/;
console.log(reg.exec(str));
console.log(str.match(reg));
//=>["130828199012040112", "130828", "1990", "12", "04", "1", index: 0, input: "130828199012040112"]
//=>第一項:大正則匹配的結果
//=>其餘項:每一個小分組單獨匹配捕獲的結果
//=>如果設定了分組(改變優先順序),但是捕獲的時候不需要單獨捕獲,可以基於?:來處理
複製程式碼
//=>既要捕獲到{數字},也想單獨的把數字也獲取到,例如:第一次找到 {0} 還需要單獨獲取0
let str = "{0}年{1}月{2}日";

/*
//=>不設定g只匹配一次,exec和match獲取的結果一致(既有大正則匹配的資訊,也有小分組匹配的資訊)
let reg = /\{(\d+)\}/;
console.log(reg.exec(str));
console.log(str.match(reg));
//["{0}", "0",...]
*/

let reg = /\{(\d+)\}/g;
//console.log(str.match(reg)); //=>["{0}", "{1}", "{2}"] 多次匹配的情況下,match只能把大正則匹配的內容獲取到,小分組匹配的資訊無法獲取
let aryBig=[],
    arySmall=[],
    res=reg.exec(str);
while(res){
    let [big,small]=res;
    aryBig.push(big);
    arySmall.push(small);
    res=reg.exec(str);
}
console.log(aryBig,arySmall); //=>["{0}", "{1}", "{2}"] ["0", "1", "2"]
複製程式碼
//=>分組的第三個作用:“分組引用”
let str = "book"; //=>"good"、"look"、"moon"、"foot"...
let reg = /^[a-zA-Z]([a-zA-Z])\1[a-zA-Z]$/; //=>分組引用就是通過“\數字”讓其代表和對應分組出現一模一樣的內容
console.log(reg.test("book")); //=>true
console.log(reg.test("deep")); //=>true
console.log(reg.test("some")); //=>false
複製程式碼

正則捕獲的貪婪性

let str = "珠峰2019@2020培訓";
//=>正則捕獲的貪婪性:預設情況下,正則捕獲的時候,是按照當前正則所匹配的最長結果來獲取的
let reg = /\d+/g;
console.log(str.match(reg)); //=>["2019","2020"]

//=>在量詞元字元後面設定?:取消捕獲時候的貪婪性(按照正則匹配的最短結果來獲取)
reg = /\d+?/g;
console.log(str.match(reg)); //=>["2", "0", "1", "9", "2", "0", "2", "0"]
複製程式碼

問號在正則中的五大作用:

  • 問號左邊是非量詞元字元:本身代表量詞元字元,出現零到一次
  • 問號左邊是量詞元字元:取消捕獲時候的貪婪性
  • (?:) 只匹配不捕獲
  • (?=) 正向預查
  • (?!) 負向預查

其它正則捕獲的方法

  1. test也能捕獲(本意是匹配)

    let str = "{0}年{1}月{2}日";
    let reg = /\{(\d+)\}/g;
    console.log(reg.test(str)); //=>true
    console.log(RegExp.$1); //=>"0"
    
    console.log(reg.test(str)); //=>true
    console.log(RegExp.$1); //=>"1"
    
    console.log(reg.test(str)); //=>true
    console.log(RegExp.$1); //=>"2"
    
    console.log(reg.test(str)); //=>false
    console.log(RegExp.$1); //=>"2" 儲存的是上次捕獲的結果
    
    //=>RegExp.$1~RegExp.$9:獲取當前本次正則匹配後,第一個到第九個分組的資訊
    複製程式碼
  2. replace 字串中實現替換的方法(一般都是伴隨正則一起使用的)

    let str = "zhufeng@2019|zhufeng@2020";
    //=>把"zhufeng"替換成"珠峰"
    //1.不用正則,執行一次只能替換一個
    /*
    str = str.replace("zhufeng","珠峰").replace("zhufeng","珠峰");
    console.log(str);
    */
    //2.使用正則會簡單一點
    str = str.replace(/zhufeng/g,"珠峰");
    console.log(str);
    複製程式碼
    let str = "zhufeng@2019|zhufeng@2020";
    //=>把"zhufeng"替換為"zhufengpeixun"
    //str=str.replace("zhufeng","zhufengpeixun").replace("zhufeng","zhufengpeixun");
    //"zhufengpeixunpeixun@2019|zhufeng@2020" 每一次替換都是從字串第一個位置開始找的(類似於正則捕獲的懶惰性)
    
    //=>基於正則g可以實現
    str = str.replace(/zhufeng/g,"zhufengpeixun");
    複製程式碼

    案例:把時間字串進行處理

    let time = "2019-08-13";
    //=>變為"2019年08月13日"
    let reg = /^(\d{4})-(\d{1,2})-(\d{1,2})$/;
    
    //=>這樣可以實現
    //time = time.replace(reg,"$1年$2月$3日");
    //console.log(time); //=>2019年08月13日
    
    //=>還可以這樣處理 [str].replace([reg],[function])
    //1.首先拿REG和TIME進行匹配捕獲,能匹配到幾次就會把傳遞的函式執行幾次(而且是匹配一次就執行一次)
    //2.不僅把方法執行,而且REPLACE還給方法傳遞了實參資訊(和exec捕獲的內容一致的資訊:大正則匹配的內容,小分組匹配的資訊....)
    //3.在函式中我們返回的是啥,就把當前大正則匹配的內容替換成啥
    /*
    time = time.replace(reg,(big,$1,$2,$3)=>{
        //=>這裡的$1~$3是我們自己設定的變數
        console.log(big,$1,$2,$3);
    });
    */
    time = time.replace(reg,(...arg)=>{
        let [,$1,$2,$3]=arg;
        $2.length<2?$2="0"+$2:null;
        $3.length<2?$3="0"+$3:null;
        return $1+"年"+$2+"月"+$3+"日";
    });
    複製程式碼

    單詞首字母大寫

    let str = "good good study,day day up!";
    let reg = /\b([a-zA-Z])[a-zA-Z]*\b/g;
    //=>函式被執行了六次,每一次都把正則匹配資訊傳遞給函式
    //=>每一次ARG:["good","g"] ["good","g"] ["study","s"]...
    str = str.replace(reg,(...arg)=>{
        let [content,$1]=arg;
        $1=$1.toUpperCase();
        content=content.substring(1);
        return $1+content;
    });
    console.log(str); //=>"Good Good Study,Day Day Up!"
    複製程式碼

    驗證一個字串中那個字母出現的次數最多,多少次?

    /*==李園園(去重思維)==*/
    let str = "zhufengpeixunzhoulaoshi";
    let obj = {};
    [].forEach.call(str, char => {
    	if (typeof obj[char] !== "undefined") {
    		obj[char]++;
    		return;
    	}
    	obj[char] = 1;
    });
    let max = 1,
    	res = [];
    for (let key in obj) {
    	let item = obj[key];
    	item > max ? max = item : null;
    }
    for (let key in obj) {
    	let item = obj[key];
    	if (item === max) {
    		res.push(key);
    	}
    }
    console.log(`出現次數最多的字元:${res},出現了${max}次`);
    
    /*==王鑫:排序==*/
    let str = "zhufengpeixunzhoulaoshi";
    str = str.split('').sort((a, b) => a.localeCompare(b)).join('');
    // console.log(str);//=>"aeefghhhiilnnoopsuuuxzz"
    let ary = str.match(/([a-zA-Z])\1+/g).sort((a, b) => b.length - a.length);
    // console.log(ary); //=>["hhh", "uuu", "ee", "ii", "nn", "oo", "zz"]
    let max = ary[0].length,
    	res = [ary[0].substr(0, 1)];
    for (let i = 1; i < ary.length; i++) {
    	let item = ary[i];
    	if (item.length < max) {
    		break;
    	}
    	res.push(item.substr(0, 1));
    }
    console.log(`出現次數最多的字元:${res},出現了${max}次`);
    
    /*==黃海艇:從最大到最小去試找==*/
    let str = "zhufengpeixunzhoulaoshi",
    	max = 0,
    	res = [],
    	flag = false;
    str = str.split('').sort((a, b) => a.localeCompare(b)).join('');
    for (let i = str.length; i > 0; i--) {
    	let reg = new RegExp("([a-zA-Z])\\1{" + (i - 1) + "}", "g");
    	str.replace(reg, (content, $1) => {
    		res.push($1);
    		max = i;
    		flag = true;
    	});
    	if (flag) break;
    }
    console.log(`出現次數最多的字元:${res},出現了${max}次`);
    複製程式碼

    其它方法:formatTime 、 queryURLParams 、 millimeter

    ~ function () {
    	/*
    	 * formatTime:時間字串的格式化處理
    	 *   @params
    	 *     templete:[string] 我們最後期望獲取日期格式的模板
    	 *     模板規則:{0}->年  {1~5}->月日時分秒
    	 *   @return
    	 *     [string]格式化後的時間字串
    	 *  by zhufengpeixun on 2019/08/13
    	 */
    	function formatTime(templete = "{0}年{1}月{2}日 {3}時{4}分{5}秒") {
    		let timeAry = this.match(/\d+/g);
    		return templete.replace(/\{(\d+)\}/g, (...[, $1]) => {
    			let time = timeAry[$1] || "00";
    			return time.length < 2 ? "0" + time : time;
    		});
    	}
    
    	/* 
    	 * queryURLParams:獲取URL地址問號和麵的引數資訊(可能也包含HASH值)
    	 *   @params
    	 *   @return
    	 *     [object]把所有問號引數資訊以鍵值對的方式儲存起來並且返回
    	 * by zhufengpeixun on 2019/08/13
    	 */
    	function queryURLParams() {
    		let obj = {};
    		this.replace(/([^?=&#]+)=([^?=&#]+)/g, (...[, $1, $2]) => obj[$1] = $2);
    		this.replace(/#([^?=&#]+)/g, (...[, $1]) => obj['HASH'] = $1);
    		return obj;
    	}
    
    	/* 
    	 * millimeter:實現大數字的千分符處理
    	 *   @params
    	 *   @return
    	 *     [string]千分符後的字串
    	 * by zhufengpeixun on 2019/08/13
    	 */
    	function millimeter() {
    		return this.replace(/\d{1,3}(?=(\d{3})+$)/g, content => content + ',');
    	}
    	
    	/* 擴充套件到內建類String.prototype上 */
    	["formatTime", "queryURLParams", "millimeter"].forEach(item => {
    		String.prototype[item] = eval(item);
    	});
    }();
    複製程式碼

相關文章