之前偶然看到一篇使用正則實現字元去重及多行去重的文章。感覺寫的有點糙,而且效能也不夠高,對新手的使用和理解都有一點難度。於是忍不住就搞了一個比較可愛的出來。而且不是一般的可愛,因為隨著字元量的增長,其效能甩出前者不知道多少條街。
知識點
這裡的實現對知識點的要求非常的低,不論你是老司機還是菜鳥,基本上一眼就能看到其真諦;
- 超好用的
Array.from()
[不知道?],當然你可以可以用經典的slice.call()
來輕鬆搞定古董瀏覽器們; - Array口杯介面
Array.prototype.reduce(Func[, initialValue]):Array|TypeLike[initialValue]
,它被廣泛應用於各種求值操作,這裡就不細講了; - 高顏值的
String.prototype.match(string|RegExp):null|Array
; - 使用評率最高的
Array.prototype.split(string|RegRxp):Array
; - 新的
Array.prototype.includes(string):boolean
,當然,你也可以使用其他介面如:indexOf()
、find()
、some()
等; - 正規表示式
注意:本文不涉及對底層介面執行原理的解析。如有感興趣,請自行查閱相關文件,進一步的瞭解前端的效能優化;
單行文字去重
//單行文字去重
function SingleLineDistinct (str) {
// Array.prototype.slice.call(str|new String(str)) 可相容不支援from介面的瀏覽器
return Array.from(str).reduce(
// 這裡應該很好明白是在幹什麼吧?
(pre,cur) => (pre.match(cur) ? pre : pre + cur),
// 需要傳入一個初始空字串引數,否則你將得到的是一個字串被拆分後的陣列。
""
);
}
多行字元去重
多行字元去重直接就是基於單行去重的簡單封裝
function MultiLineCharDistinct (mlstr) {
// 是不是超級簡單?
return mlstr.split("
").map(SingleLineDistinct).join("
")
}
多行行去重
這個也是非常的簡單的,用一下陣列判斷介面就行啦。
function MultiLineDistinct (str, spl = "
") {
// 這裡就不能給reduce傳入初始空字串了,因為那樣會返回
return str.split(spl).reduce(
// 判斷一下,初始陣列中有沒有與當前行相同的字串,沒有則push當前行,並返回陣列;
(pre,cur) => (!pre.includes(cur) && pre.push(cur),pre),
[]
)
// 進行行拆分
.join(spl);
}
見證奇蹟的時刻到了
這裡還是貼一下前面提到的運用正則進行單行去重的程式碼吧:
function DistinctString(s){
var a;
while((a=s.replace(/(.)(.*?)1/,"$1$2"))!=s) s=a;
return s;
}
接下來我們就來進行兩個單行去重函式的效能進行比較了:【高能預警!】
首先,我們給SingleLineDistinct()
和DistinctString()
函式新增執行時間列印console.time()
和console.timeEnd()
[這裡非本文重點,不做應用闡述],變成了這樣:
function DistinctString(s){
console.time(`dstring`);
var a;
while((a=s.replace(/(.)(.*?)1/,"$1$2"))!=s) s=a;
console.timeEnd(`dstring`);
return s;
}
//單行文字去重
function SingleLineDistinct (str) {
console.time(`sldist`);
str = Array.from(str).reduce(
(pre,cur) => (pre.match(cur) ? pre : pre + cur),
""
);
console.timeEnd(`sldist`);
return str;
}
我們定義一個let str = "lsdjfl...."
的隨機重複字元變數,然後就該它們倆發揮了:
咦~~,彼此彼此嘛…
DistinctString:不好意思,失誤,再來!
DistinctString:SingleLineDistinct你等等我呀!
SingleLineDistinct:不好意思,你實在太慢了。
哈哈哈哈,怎麼樣,是不是很有趣?希望你各位喜歡。如果你們有更好更快的方法,歡迎交流喲~
宣告:本文的內容並不是對正規表示式的否定,正則的牛逼之處是無可替代的,請各位不要誤解。僅僅是想通過這樣一個栗子,告訴大家每一種方法都有它的長處和短處。想要編寫高效能、高質量的程式碼,那麼你就必須要了解其執行原理和底層技術,這樣才能讓你在程式設計時選擇更好的程式碼組織模式,提高應用的執行效率。