【研發日記五】解密社交系統ThinkSNS+如何計算字元顯示長度!

ThinkSNS發表於2017-05-27

今天我們來聊一下可能很多人都會頭疼的東西:顯示長度。

需求是這樣的,在字元的顯示上,兩個英文單詞才佔一箇中文或者其他語言的顯示長度。如下:

上面排的是兩個英文字母,一個漢字,一個Emoji。你會發現,在顯示上佔的寬度是一致的。一些設計上為了好看也要求有這樣的處理。

例如,我們的使用者名稱需求是最多12個非單位元組字元或者24個單位元組字元的需求也可以混合排的需求,我們寫後端不得不處理這樣的驗證了。

需求規則是 /^[a-zA-Z_\x7f-\xff][a-zA-Z0-9_\x7f-\xff]*$/

在ThinkSNS+中,為了能把這部分驗證公用,所以選擇使用自定義驗證規則。我們先說下計算的實現思路吧!

首先,就算是mb_strlen也沒法準確的獲取多位元組字元和單子節字元混合在一起的長度,網上有個說法,漢字佔三個位元組,英文陣列半形符號佔一個位元組,所以:

用這個方法可以得到單位元組佔0.5多位元組佔1的計算。但是以中文為例,只有兩萬個漢字才是這種情況,還有六萬多漢字是四個,其次,emoji也是四個位元組。根本無法準確的計算。

好在在無意間發現一個奇怪的東西str_word_count 這個函式計算非英文單詞外是除了符號例如中文就是按照漢字個數算的,emoji也是同理。

發現這個以後,我們們就好辦了。我們吧使用者名稱中的 [a-aA-Z0-9_] 剔除掉,單獨計算不就是我們要的驗證長度了嗎?

所以,首先我們用:

方式單獨計算出單位元組字元的顯示長度,再用:

方式計算出多位元組的長度,最後:

就得出了顯示長度,實現了,最後封裝成驗證規則:

程式碼是原型程式碼,還沒有進行最佳化,之後我們只要按照下面的方式用:

現在就很好的解決了這個需求。

我們很樂意,將基於 Laravel 的 ThinkSNS+ 產品開發中的技術解決方案分享給大家,也希望喜歡的朋友能給國內開源產品一點點的支援。

【開原始碼倉庫】

GitHub:(點選star,每日關注開發動態。)

ThinkSNS官網:

開源不易,為了爭取開源,我們團隊做了很多努力。把基於Laravel的作品展示在大家面前,之後專欄會持續不斷的分享ThinkSNS +開發過程中的技術細節。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31448874/viewspace-2139997/,如需轉載,請註明出處,否則將追究法律責任。

相關文章