JS單行、多行文字字元去重和行去重

JasonD發表於2019-02-16

之前偶然看到一篇使用正則實現字元去重及多行去重的文章。感覺寫的有點糙,而且效能也不夠高,對新手的使用和理解都有一點難度。於是忍不住就搞了一個比較可愛的出來。而且不是一般的可愛,因為隨著字元量的增長,其效能甩出前者不知道多少條街。

知識點

這裡的實現對知識點的要求非常的低,不論你是老司機還是菜鳥,基本上一眼就能看到其真諦;

  • 超好用的Array.from()[不知道?],當然你可以可以用經典的slice.call()來輕鬆搞定古董瀏覽器們;
  • Array口杯介面Array.prototype.reduce(Func[, initialValue]):Array|TypeLike[initialValue],它被廣泛應用於各種求值操作,這裡就不細講了;
  • 高顏值的String.prototype.match(string|RegExp):null|Array
  • 使用評率最高的Array.prototype.split(string|RegRxp):Array;
  • 新的Array.prototype.includes(string):boolean,當然,你也可以使用其他介面如:indexOf()find()some()等;
  • 正規表示式
注意:本文不涉及對底層介面執行原理的解析。如有感興趣,請自行查閱相關文件,進一步的瞭解前端的效能優化;

單行文字去重

//單行文字去重
function SingleLineDistinct (str) {
    // Array.prototype.slice.call(str|new String(str)) 可相容不支援from介面的瀏覽器
    return Array.from(str).reduce(
        // 這裡應該很好明白是在幹什麼吧?
        (pre,cur) => (pre.match(cur) ? pre : pre + cur), 
        // 需要傳入一個初始空字串引數,否則你將得到的是一個字串被拆分後的陣列。
        ""
    ); 
}複製程式碼

多行字元去重

多行字元去重直接就是基於單行去重的簡單封裝

function MultiLineCharDistinct (mlstr) {
    // 是不是超級簡單?
    return mlstr.split("\n").map(SingleLineDistinct).join("\n")
}複製程式碼

多行行去重

這個也是非常的簡單的,用一下陣列判斷介面就行啦。

function MultiLineDistinct (str, spl = "\n") {
    // 這裡就不能給reduce傳入初始空字串了,因為那樣會返回
    return str.split(spl).reduce(
        // 判斷一下,初始陣列中有沒有與當前行相同的字串,沒有則push當前行,並返回陣列;
        (pre,cur) => (!pre.includes(cur) && pre.push(cur),pre),
        []
    )
    // 進行行拆分
    .join(spl); 
}複製程式碼

見證奇蹟的時刻到了

這裡還是貼一下前面提到的運用正則進行單行去重的程式碼吧:

function DistinctString(s){
    var a;
    while((a=s.replace(/(.)(.*?)\1/,"$1$2"))!=s) s=a;
    return s;
}複製程式碼

接下來我們就來進行兩個單行去重函式的效能進行比較了:【高能預警!】

首先,我們給SingleLineDistinct()DistinctString()函式新增執行時間列印console.time()console.timeEnd()[這裡非本文重點,不做應用闡述],變成了這樣:

function DistinctString(s){
    console.time('dstring');
    var a;
    while((a=s.replace(/(.)(.*?)\1/,"$1$2"))!=s) s=a;
    console.timeEnd('dstring');
    return s;
}複製程式碼
//單行文字去重
function SingleLineDistinct (str) {
    console.time('sldist');
    str = Array.from(str).reduce(
        (pre,cur) => (pre.match(cur) ? pre : pre + cur), 
        ""
    ); 
    console.timeEnd('sldist');
    return str;
}複製程式碼

我們定義一個let str = "lsdjfl...."的隨機重複字元變數,然後就該它們倆發揮了:

clipboard.png
咦~~,彼此彼此嘛...

clipboard.png
DistinctString:不好意思,失誤,再來!

clipboard.png
DistinctString:SingleLineDistinct你等等我呀!

clipboard.png
SingleLineDistinct:不好意思,你實在太慢了。

哈哈哈哈,怎麼樣,是不是很有趣?希望你各位喜歡。如果你們有更好更快的方法,歡迎交流喲~

宣告:本文的內容並不是對正規表示式的否定,正則的牛逼之處是無可替代的,請各位不要誤解。僅僅是想通過這樣一個栗子,告訴大家每一種方法都有它的長處和短處。想要編寫高效能、高質量的程式碼,那麼你就必須要了解其執行原理和底層技術,這樣才能讓你在程式設計時選擇更好的程式碼組織模式,提高應用的執行效率。


相關文章