JavaScript正則,看這篇就夠了

duffy發表於2018-04-09

寫在前面

正則的使用,相信大家工作中常用到的莫過於,表單驗證:驗證使用者輸入的內容是否符合我們設定的規則,例如:郵箱、電話、密碼...,當然公司業務不同,手寫能力強同學也可以用資料採集:在一堆資料中把我們需要的資料獲取到,今天順帶總結一下,例如::

  • URL傳參(問號傳參) 從列表頁到詳細頁(或者其他的頁面),我們點選不同的列表,在詳細頁面看到的內容也不同,但是詳細頁是同一個頁面,想要展示不同的內容,需要把URL地址中的,?後面傳遞進來的引數獲取到,通過傳遞過來的引數值的不一樣展示不同的內容
  • 資訊採集:把一些資料轉變為我們想要的格式,例如:"2018-4-3 12:14:00" ->"2016年04月03日"

今天順帶總結一下; 正則是什麼 正則就是用來處理字串的:匹配字串的格式是否符合既定的格式(正則的匹配)、把一個字串中符合既定格式的內容獲取到(正則的捕獲); test和exec是正則裡面的方法 test->匹配

   var reg = /\d/;//-> \d一個0-9之間的數字 ->包含一個0-9之間的數字的規則
       console.log(reg.test("2016"));//->true
       console.log(reg.test("duff990fff"));//->true
       console.log(reg.test("dufffff"));//->false
複製程式碼

exec->捕獲

   var reg = /\d/g;
       console.log(reg.exec("2016"));//->["2", index: 0, input: "2016"]
       console.log(reg.exec("2016"));//->["0"...]
       console.log(reg.exec("2016"));//->["1"...]
       console.log(reg.exec("2016"));//->["6"...]
複製程式碼

正則的組成 每個正則都是由元字元和修飾符兩部分組成, “/”裡面的 內容稱為元字元 “/” [修飾符]g、i、m

    g(global)->全域性匹配
    i(ignoreCase)->忽略大小寫匹配
    m(multiline)->換行匹配
複製程式碼

正則常用的元字元

以下列出的都是常用的元字元,如果是不瞭解的童鞋需要,浪費你10分鐘時間記一下,終身受益哈~ 元字元:只要在//之間包含的所有的字元都是元字元

1)具有特殊意義的元字元

      \d -> 匹配一個0-9的數字,相當於[0-9],和它相反的是\D ->匹配一個除了0-9的任意字元
       \w -> 匹配一個0-9、a-z、A-Z、_的數字或字元,相當於[0-9a-zA-Z_]
       \s -> 匹配一個空白字元(空格、製表符...)
       \b -> 匹配一個單詞的邊界
       \t -> 匹配一個製表符
       \n -> 匹配一個換行
       . -> 匹配一個除了\n以外的任意字元
       ^ -> 以某一個元字元開頭
       $ -> 以某一個元字元結尾
       \ -> 轉義字元
       x|y -> x或者y的一個
       [xyz] -> x、y、z中的任意一個
       [^xyz] -> 除了xyz中的任意一個字元
       [a-z] -> 匹配a-z中的任意一個字元
       [^a-z] -> 匹配除了a-z中的任意一個字元
       () -> 正則中的分組
複製程式碼

2)代表出現次數的"量詞元字元"

    ->+ : 出現一到多次
    ->* : 出現零到多次
    ->? : 出現零到一次
    ->{n} : 出現n次
    ->{n,} : 出現n到多次
    ->{n,m} : 出現n-m次
複製程式碼

小試牛刀

-> ^/$
       var reg = /\d+/;//->包含一到多個數字(0-9)即可
       console.log(reg.test("duffy2016"));//->true

       reg = /^\d+$/;//->只能是一到多個數字
       console.log(reg.test("duffy2016"));//->false
       console.log(reg.test("2016"));//->true
複製程式碼
-> .
       var reg = /^2.6$/;
       console.log(reg.test("2.6"));//->true
       console.log(reg.test("2@6"));//->true
    
       reg = /^2\.6$/;//->\是轉義字元:把.這個特殊意義(任意字元)的元字元轉變為只代表本身意義(小數點)的一個普通元字元
       console.log(reg.test("2.6"));//->true
       console.log(reg.test("2@6"));//->false
複製程式碼
//->[]
    //->在中括號中出現的所有字元(不管之前代表什麼意思),在這裡都是隻代表本身的意思
    //var reg = /^[2.3]$/;//->.這裡只代表小數點,不是任意字元了
    //reg = /^[\dz]$/;//->\d本身整體就是0-9之間的數字,在這裡還是這個意思
複製程式碼
//->在中括號中出現的兩位數不是一個兩位數,而是左邊或者右邊的
//var reg = /^[10-23]$/;//->1或者0-2或者3
複製程式碼
在中括號中"-"具有連字元的作用,如果只想表示-,需要把其放在末尾
    //var reg = /^[12-]$/;

    //->中括號本身也有特殊的意思,如果需要只代表中括號本身的意思,需要進行轉義
    //var reg = /^\[\d+\]$/;//->"[200]"
複製程式碼
//->x|y
//var reg = /^1|2$/;//->和這個有區別:/^[12]$/
//->1、2、12
複製程式碼
    //var reg = /^10|28$/;
    //->10、28、1028、102、108、128、028 ->不是我們想要的那個10或者28了

複製程式碼

()分組:把一個大正則劃分成幾個小正則 1)改變正則的預設優先順序

//var reg = /^(10|28)$/;//->10或者28
複製程式碼

2)分組的第二個作用:分組引用

    "wood" "foot" "week" "feel" "door" "food" "good" "cool"...
    var reg = /^[a-z]([a-z])\1[a-z]$/i;//->\1出現和第一個分組一模一樣的內容
複製程式碼

5、建立一個正則也有兩種方式:字面量方式、例項建立的方式

    //->例項建立第一引數值是字串
    //->想要和字面量方式保持統一的話,對於\d \w \n...這些都需要多加一個\,使其\d具有自己的特殊的意義
  var reg = /^\d+$/ig;
console.log(reg.test("2016"));//->true
reg = new RegExp("^\d+$", "ig");
console.log(reg.test("2016"));//->false
reg = new RegExp("^\\d+$", "ig");
console.log(reg.test("2016"));//->true
複製程式碼
    //->對於[]、()這類的是沒有區別的
    //    var reg = /^[0-9]$/;
    //    console.log(reg.test("0"));//->true
    //    reg = new RegExp("^[0-9]$");
    //    console.log(reg.test("0"));//->true

    //->在例項建立的方式中,我們只要出現\,基本上都是要寫\\的
    //    var reg = /^\[100\]$/;
    //    console.log(reg.test("[100]"));//->true
    //    reg = new RegExp("^\[100\]$");
    //    console.log(reg.test("[100]"));//->false
    //    reg = new RegExp("^\\[100\\]$");
    //    console.log(reg.test("[100]"));//->true
複製程式碼

當一個正規表示式中需要把一個變數的值作為一個動態的規則:我們只能使用例項建立的方式 // var reg = /^duffy"+num+"peixun$/;//->在//之間包起來的都是元字元,有的是特殊的,有的就是代表本身意思的 ->以z開頭,hufeng,出現一到多個",nu,出現一個到一個m,",peixun ->總之一句話:字面量方式中不存在什麼字串,也就沒有所謂的字串拼接,把變數的值拼接過來這一說了

    //    console.log(reg.test("duffy2016peixun"));//->false

    //    var num = 2016;
    //    var reg = new RegExp("^duffy" + num + "peixun$");
    //    console.log(reg.test("duffy2016peixun"));//->true
複製程式碼
//字面量建立出來的是基本資料型別的值(不是嚴謹的例項,因為不能使用instanceof 檢測是否是Number的例項),例項建立出來的是物件資料型別的值
//    var num = 12;
//    var num = new Number(12);
複製程式碼

常用的正規表示式

1、手機號:11位數字、都是以1開頭的

var reg = /^1\d{10}$/;

2、真實姓名(中國):兩到四位的漢字

var reg = /^[\u4e00-\u9fa5]{2,4}$/;

3、驗證郵箱

// 1633397595@qq.com
// 1633397595@163.com.cn
// 1633397595@163.com
// duffy_youxiang@tengxu.cn
//var reg7 = /^[\w.-]+@$/  //@分解兩邊 左邊任意,\w 數字,大小寫字元_ - . 右邊
var reg7 = /^[\w.-]+@([1-9]|[a-z]|[A-Z])+(\.[A-Za-z]{2,4}){1,2}$/
console.log(reg7.test('1633397595@qq.com'))
複製程式碼

4、驗證有效數字的

  0 -12 -12.3 -12.0 12.3 12.0
    ->可能出現"-"也可能不出現,出現的話只能出現一次
    ->整數部分是一到多個數字,但是兩位數及以上的話不能以0開頭
    ->小數部分可能有可能沒有,一但有必須是 .後面跟一位或者多位數字
    var reg = /^-?(\d|([1-9]\d+))(\.\d+)?$/;
複製程式碼

5、年齡:18-65之間

    18-19  /^1(8|9)$/
    20-59  /^[2-5]\d$/
    60-65  /^6[0-5]$/
    var reg = /^((18|19)|([2-5]\d)|(6[0-5]))$/;
複製程式碼

正則的捕獲

正則的捕獲分為兩個階段: 匹配:首先驗證字串和正則是否匹配,不匹配的話捕獲到的結果為null

       var str = "dafei";
       var reg = /\d+/;
       console.log(reg.exec(str));//->null
複製程式碼

捕獲:把正則匹配到的內容捕獲到:捕獲到的結果是一個陣列,陣列第一項是當前正則匹配捕獲的內容,index:捕獲的開始索引位置,input:捕獲的原始字串 每一次執行exec只能捕獲到一個匹配的,想把所有匹配的都捕獲到,至少要執行多次 ->但是一般情況下,我們不管執行多少次,每一次捕獲的內容都是和第一次一模一樣,後面的2017是捕獲不到的 "正則捕獲的懶惰性"

       var str = "duffy2016peixun2017";
       var reg = /\d+/;
       console.log(reg.exec(str));//->["2016", index: 7, input: "duffy2016peixun2017"]
       console.log(reg.exec(str));//->["2016"...]
複製程式碼

為啥會出現懶惰性? reg.lastIndex:正則每一次捕獲的時候,在字串中開始查詢的索引, 正則每一次捕獲結束後,預設的沒有把lastIndex值進行修改,lastIndex一直是零,導致第二次捕獲還是從字串的起始位置開始查詢,導致每一次捕獲的都是第一個和正則匹配的

    var str = "duffy2016peixun2017";
       var reg = /\d+/;
       console.log(reg.lastIndex);//->0 捕獲的時候是從字串開始的位置進行查詢的
       console.log(reg.exec(str));//->["2016"...]
       console.log(reg.lastIndex);//->0 第二次捕獲的話還是從字串索引為零的位置開始查詢
       console.log(reg.exec(str));//->["2016"...]
複製程式碼

有n個的匹配的就需要執行n次exec這個方法,比較的麻煩,生活如此美好,何必這麼麻煩? ->字串中提供了一個叫做match的方法,這個方法可以一次執行把所有匹配的捕獲到

       var str = "duffy2016peixun2017";
       var reg = /\d+/g;//->不管用哪個方法,g是不能少的
       console.log(str.match(reg));//->["2016", "2017"]
複製程式碼

但是match也有自己的侷限性? 如果正則中出現分組,而且需要執行多次exec才能全部捕獲的,使用match不能把分組的內容捕獲到.最佳解決方案 ---replace,replace天生為正則而生

複製程式碼

實戰

格式化時間字串

var str = "2016-04-03";//->"2016年04月03日"
let reg = /^([1-9]\d{3})-(0?[1-9]|1[1-2])-([02]\d|[3][0-1])$/
console.log(reg.test(str))
str.replace(reg,function(){
  console.log(arguments)
  return arguments[1] + '年' + arguments[2] + '月' + + arguments[3] + '日'
})

function format(str) {
  var reg = /^([1-9]\d{3})-(0?[1-9]|1[1-2])-([02]\d|[3][0-1])$/g
  if (!reg.test(str)) return '輸入日期格式不合法'
  return (str.replace(reg,function(){
    // console.log(arguments)
    return arguments[1] + '年' + arguments[2] + '月' + + arguments[3] + '日'
  }))
}
console.log(format('2018-12-30'))   -> '2018年12月30日
複製程式碼

數字大寫轉換

   var str = "123678";//->"壹貳叄陸柒捌"
       var ary = ["零", "壹", "貳", "叄", "肆", "伍", "陸", "柒", "捌", "玖"];
       str = str.replace(/\d/g, function () {
           //console.log(arguments[0]);//->每一次捕獲到的內容(我們要的數字)
           return ary[arguments[0]];
       });
       console.log(str);
複製程式碼

簡易模板引擎實現的原理

var data = ['duffy', '27', 'china', 'javascript']
var str = "my name is {0},my age is {1},i com from {2},i can do {3}~~";

var reg = /\{(\d)\}/g
console.log(reg.test(str))
str = str.replace(reg, function(){
  return data[arguments[1]]
})
複製程式碼

相關文章