phputf-8編碼正則匹配中文
首先unicode裡面 中文的區域的0x4e00-0x9fa5
在java或者js這種已unicode編碼處理字串的程式語言中
/^[u4e00-u9fa5]+$/就可以判斷一個字串是否全部為中文
那麼php中 字元的編碼根據頁面而定
頁面是gbk的 字元編碼就是gbk的 utf-8也同理
之前有一個表示式 “/^[x80-xff]+$/”
僅僅可以匹配是否含有非ascll字元
而漢字只是其中一個比較小的區域 不太精確
由於我的頁面編碼是utf-8的
於是把js的表示式搬到php中來
提示PCRE不支援”u”和其他亂七八糟的一大堆東西
後來查資料瞭解到 php的正則有一種叫做字元組的東西
用x{…}表示
於是把表示式改成”/^[x{4e00}-x{9fa5}]+$/”
又提示”x”表示式後的數字太大
又查了資料 瞭解到可以使用修正模式”u” 讓程式把後面當成unicode字元處理
於是改成了”/^[x{4e00}-x{9fa5}]+$/u” 測試成功
所以php下正則匹配中文的表示式是 “/^[x{4e00}-x{9fa5}]+$/u”
這個僅適用於utf-8編碼
相關文章
- PHP 正則匹配中文PHP
- Python正則匹配中文Python
- 正則匹配規則2
- 編寫正則:匹配郵箱 手機號 密碼以及身份證號密碼
- php 正則如何匹配手機號碼呢?PHP
- 匹配中文正規表示式程式碼例項
- Logstash之Grok正則匹配,讓正則進階!
- Java處理正則匹配卡死(正則回溯問題)Java
- 匹配統一社會信用程式碼的正則
- Laravel redis 正則匹配keysLaravelRedis
- 正則匹配方法及示例
- 07 nginx Location之正則匹配Nginx
- python的re正則匹配Python
- JavaScript匹配中文正規表示式JavaScript
- oracle10g的正則規則匹配Oracle
- shell正則匹配捕獲引用進行IP匹配
- 匹配純小寫英文字元正則程式碼字元
- VS Code 正則匹配(冗餘程式碼批量清理方法)
- java中url正則regex匹配Java
- php正則匹配所有違規字元PHP字元
- Linux篇---Grep和正則匹配Linux
- 正則匹配指定字元之前的字串字元字串
- iOS擷取特定的字串(正則匹配)iOS字串
- VIM-灰常有用的正則匹配
- Oracle正規表示式匹配中文的方法Oracle
- 學習筆記——正則匹配方法整理筆記
- 探究js正則匹配方法:match和execJS
- js中split之正則運用(模式匹配)JS模式
- 隨手查閱的正則匹配筆記筆記
- python正則一些簡單匹配Python
- MySQL全面瓦解8:查詢的正則匹配MySql
- js正則全域性匹配引發的血案JS
- js Abba逆向前瞻正則匹配例項JS
- PHP 正則 preg_match 匹配長度限制PHP
- php正則匹配到字串裡面的a標籤PHP字串
- Java使用正則獲取字串中匹配欄位Java字串
- Go語言中使用正則提取匹配的字串Go字串
- 正則匹配閉合HTML標籤(支援巢狀)HTML巢狀