phputf-8編碼正則匹配中文

首先unicode裡面中文的區域的0x4e00-0x9fa5
在java或者js這種已unicode編碼處理字串的程式語言中
/^[u4e00-u9fa5]+$/就可以判斷一個字串是否全部為中文

那麼php中字元的編碼根據頁面而定
頁面是gbk的字元編碼就是gbk的 utf-8也同理
之前有一個表示式 “/^[x80-xff]+$/”
僅僅可以匹配是否含有非ascll字元
而漢字只是其中一個比較小的區域不太精確

由於我的頁面編碼是utf-8的
於是把js的表示式搬到php中來
提示PCRE不支援”u”和其他亂七八糟的一大堆東西

後來查資料瞭解到 php的正則有一種叫做字元組的東西
用x{…}表示
於是把表示式改成”/^[x{4e00}-x{9fa5}]+$/”
又提示”x”表示式後的數字太大

又查了資料瞭解到可以使用修正模式”u” 讓程式把後面當成unicode字元處理
於是改成了”/^[x{4e00}-x{9fa5}]+$/u” 測試成功

所以php下正則匹配中文的表示式是 “/^[x{4e00}-x{9fa5}]+$/u”
這個僅適用於utf-8編碼

PHP 正則匹配中文
2020-09-24
PHP
Python正則匹配中文
2018-07-30
Python
正則匹配規則2
2024-04-19
編寫正則：匹配郵箱手機號密碼以及身份證號
2019-09-25
密碼
php 正則如何匹配手機號碼呢？
2021-04-06
PHP
匹配中文正規表示式程式碼例項
2017-03-03
Logstash之Grok正則匹配，讓正則進階！
2022-11-17
Java處理正則匹配卡死（正則回溯問題）
2023-03-01
Java
匹配統一社會信用程式碼的正則
2020-02-03
Laravel redis 正則匹配keys
2021-03-09
LaravelRedis
正則匹配方法及示例
2020-09-25
07 nginx Location之正則匹配
2015-01-26
Nginx
python的re正則匹配
2024-03-25
Python
JavaScript匹配中文正規表示式
2018-05-28
JavaScript
oracle10g的正則規則匹配
2008-07-29
Oracle
shell正則匹配捕獲引用進行IP匹配
2023-05-02
匹配純小寫英文字元正則程式碼
2020-02-17
字元
VS Code 正則匹配（冗餘程式碼批量清理方法）
2018-04-18
java中url正則regex匹配
2020-04-06
Java
php正則匹配所有違規字元
2021-03-27
PHP字元
Linux篇---Grep和正則匹配
2018-01-19
Linux
正則匹配指定字元之前的字串
2018-05-07
字元字串
iOS擷取特定的字串(正則匹配)
2017-12-13
iOS字串
VIM-灰常有用的正則匹配
2024-03-12
Oracle正規表示式匹配中文的方法
2012-06-27
Oracle
學習筆記——正則匹配方法整理
2019-03-04
筆記
探究js正則匹配方法：match和exec
2019-04-22
JS
js中split之正則運用(模式匹配)
2019-04-29
JS模式
隨手查閱的正則匹配筆記
2019-01-28
筆記
python正則一些簡單匹配
2021-09-09
Python
MySQL全面瓦解8：查詢的正則匹配
2020-11-10
MySql
js正則全域性匹配引發的血案
2020-09-27
JS
js Abba逆向前瞻正則匹配例項
2022-03-18
JS
PHP 正則 preg_match 匹配長度限制
2017-12-21
PHP
php正則匹配到字串裡面的a標籤
2017-08-09
PHP字串
Java使用正則獲取字串中匹配欄位
2018-09-04
Java字串
Go語言中使用正則提取匹配的字串
2018-02-11
Go字串
正則匹配閉合HTML標籤（支援巢狀）
2014-07-10
HTML巢狀

phputf-8編碼正則匹配中文

相關文章