go語言標準庫 - regexp

dawnchen發表於2019-04-11

一、目錄

二、regexp

1. 簡介

go語言提供豐富的正則函式以覆蓋各種日常正則需求。
與go語言標準庫風格一樣,該標準庫先定義了一個結構體Regexp,然後在這個結構體上掛載功能函式。
最後提供初始化函式,並封裝幾個簡單的函式(標準實現),方便我們進行基礎使用。

1.1. Regexp初始化函式

  1. func Compile(expr string) (*Regexp, error)
    以正規表示式為基礎返回Regexp實體。
  2. func CompilePOSIX(expr string) (*Regexp, error)
    以正規表示式為基礎返回Regexp實體。但是正規表示式需要符合POSIX ERE (egrep) 語法。
  3. func MustCompile(str string) *Regexp
    如果不能解析正規表示式則直接觸發panic。
  4. func MustCompilePOSIX(str string) *Regexp
    正規表示式需要符合POSIX ERE (egrep) 語法。如果不能解析正規表示式則直接觸發panic。

1.2. 標準實現

  1. func Match(pattern string, b []byte) (matched bool, err error)
    判斷位元組切片b,是否匹配正則pattern
  2. func MatchReader(pattern string, r io.RuneReader) (matched bool, err error)
    正則匹配io.RuneReader
  3. func MatchString(pattern string, s string) (matched bool, err error)
    正則匹配字串
  4. func QuoteMeta(s string) string
    將正規表示式元字元轉義並返回。

1.3. Regexp掛載方法

1. 正則查詢

func (re *Regexp) Expand(dst []byte, template []byte, src []byte, match []int) []byte
func (re *Regexp) ExpandString(dst []byte, template string, src string, match []int) []byte
func (re *Regexp) Find(b []byte) []byte
func (re *Regexp) FindAll(b []byte, n int) [][]byte func (re *Regexp) FindAllIndex(b []byte, n int) [][]int
func (re *Regexp) FindAllString(s string, n int) []string
func (re *Regexp) FindAllStringIndex(s string, n int) [][]int
func (re *Regexp) FindAllStringSubmatch(s string, n int) [][]string
func (re *Regexp) FindAllStringSubmatchIndex(s string, n int) [][]int
func (re *Regexp) FindAllSubmatch(b []byte, n int) [][][]byte
func (re *Regexp) FindAllSubmatchIndex(b []byte, n int) [][]int
func (re *Regexp) FindIndex(b []byte) (loc []int)
func (re *Regexp) FindReaderIndex(r io.RuneReader) (loc []int)
func (re *Regexp) FindReaderSubmatchIndex(r io.RuneReader) []int
func (re *Regexp) FindString(s string) string
func (re *Regexp) FindStringIndex(s string) (loc []int)
func (re *Regexp) FindStringSubmatch(s string) []string
func (re *Regexp) FindStringSubmatchIndex(s string) []int
func (re *Regexp) FindSubmatch(b []byte) [][]byte
func (re *Regexp) FindSubmatchIndex(b []byte) []int

2. 正則匹配

func (re *Regexp) LiteralPrefix() (prefix string, complete bool)
func (re *Regexp) Match(b []byte) bool
func (re *Regexp) MatchReader(r io.RuneReader) bool
func (re *Regexp) MatchString(s string) bool

3. 正則替換

func (re *Regexp) ReplaceAll(src, repl []byte) []byte
func (re *Regexp) ReplaceAllFunc(src []byte, repl func([]byte) []byte) []byte
func (re *Regexp) ReplaceAllLiteral(src, repl []byte) []byte
func (re *Regexp) ReplaceAllLiteralString(src, repl string) string
func (re *Regexp) ReplaceAllString(src, repl string) string
func (re *Regexp) ReplaceAllStringFunc(src string, repl func(string) string) string

4. 其他

func (re *Regexp) Copy() *Regexp
func (re *Regexp) Longest()
func (re *Regexp) NumSubexp() int
func (re *Regexp) Split(s string, n int) []string
func (re *Regexp) String() string
func (re *Regexp) SubexpNames() []string

2. 使用標準實現

package main

import (
	"fmt"
	"regexp"
)

func main() {
	matched, err := regexp.Match(`foo*`, []byte(`food`))
	fmt.Println(matched, err)
	matched, err = regexp.Match(`foo*`, []byte(`water`))
	fmt.Println(matched, err)
}

複製程式碼

3. 使用掛載函式

package main

import (
	"fmt"
	"regexp"
)

func main() {
	findRes := regexp.MustCompile(`foo*`).FindAllString("food fool foot foolish", -1)
	fmt.Println(findRes)
	// replaceRes := regexp.MustCompile(`foo\s+$`).ReplaceAllString("food fool foot foolish", "xxx")
	// fmt.Println(replaceRes)
}
複製程式碼

相關文章