工作學習筆記(二) 正規表示式(轉載)

小张不嚣张。發表於2024-11-07
  • 正規表示式
    正規表示式是一種用於匹配和操作文字的強大工具,是由一系列字元和特殊字元組成的模式,用於描述要匹配的文字模式。
    正規表示式可以在文字中查詢、替換、提取和驗證特定的模式。正規表示式主要用於複雜文字處理,如模式匹配、格式檢驗、文字替換等。常用的萬用字元有:^, $, *, ., , -, +, ?, &, |, (), [], {}

  • 為什麼要使用正規表示式
    典型的搜尋和替換操作要求您提供與預期的搜尋結果匹配的確切文字。雖然這種技術對於對靜態文字執行簡單搜尋和替換任務可能已經足夠了,但它缺乏靈活性,若採用這種方法搜尋動態文字,即使不是不可能,至少也會變得很困難。

  • 運算子優先順序

    • 轉義符號: \ 是用於轉義其他特殊字元的轉義符號。它具有最高的優先順序。
      示例:\d、. 等,其中 \d 匹配數字,. 匹配點號。

    • 括號: 圓括號 () 用於建立子表示式,具有高於其他運算子的優先順序。
      示例:(abc)+ 匹配 "abc" 一次或多次。

    • 量詞: 量詞指定前面的元素可以重複的次數。
      示例:a* 匹配零個或多個 "a"。

    • 字元類: 字元類使用方括號 [] 表示,用於匹配括號內的任意字元。
      示例:[aeiou] 匹配任何一個母音字母。

    • 斷言: 斷言是用於檢查字串中特定位置的條件的元素。
      示例:^ 表示行的開頭,$ 表示行的結尾。

    • 連線: 連線在沒有其他運算子的情況下表示字元之間的簡單連線。
      示例:abc 匹配 "abc"。

    • 管道: 管道符號 | 表示"或"關係,用於在多個模式之間選擇一個。
      示例:cat|dog 匹配 "cat" 或 "dog"。

  • 正規表示式修飾符

  • i
    含義:ignore - 不區分大小寫,描述:將匹配設定為不區分大小寫,搜尋時不區分大小寫: A 和 a 沒有區別。

  • g
    含義:global - 全域性匹配,描述:查詢所有匹配項

  • m
    含義:multi line - 多行匹配,描述:使邊界字元 ^ 和 $ 匹配每一行的開頭和結尾,記住是多行,而不是整個字串的開頭和結尾。

  • s
    含義:特殊字元圓點 . 中包含換行符\n,描述:預設情況下的圓點 . 是匹配除換行符 \n 之外的任何字元,加上 s 修飾符之後, . 中包含換行符 \n。

相關文章