深藍詞庫轉換2.4版釋出,支援最新的搜狗使用者詞庫備份bin格式

深藍發表於2018-10-17

很高興的告訴大家,感謝GitHub上的h4x3rotab提供python版的搜狗使用者詞庫備份bin格式的解析演算法,感謝tmxkn1提供了C#版的實現,深藍詞庫轉換終於迎來了一個重大更新,能夠支援搜狗使用者詞庫的bin格式備份的匯出了。再也不用受到搜狗輸入法的鉗制,可以自由切換到其他輸入法了。搜狗bin詞庫只解析到了使用者詞條和詞頻,沒有拼音,所以如果要匯出其他拼音輸入法,中間轉換工具會根據詞條的內容重新生成拼音。

image

另外在2.4版中,增加了使用者詞頻強制設定的功能,比如將搜狗使用者詞庫bin格式備份轉換為Win10自帶的微軟拼音,那麼詞頻會導致該詞條在微軟拼音上的位置不對,那麼我們就需要忽略掉搜狗bin格式解析出來詞頻,而是使用1表示詞頻,這樣在微軟拼音中才會顯示正常。

image

設定了強制的預設詞頻後,所有詞頻將按照新詞頻演算法生成。

image

匯入到Win10自帶微軟拼音的使用者自定義短語後的效果如圖:

image

最新版的深藍詞庫轉換的下載地址:

https://github.com/studyzy/imewlconverter/releases

最後,再聲討一下一個叫“ 奧創詞庫轉換”的,把我的深藍詞庫轉換程式碼拿來改一下介面,就變成了自己的軟體,極度無恥和噁心。深藍詞庫轉換一直是免費綠色開源的,但是也看不慣這種無底線的剽竊行為,強烈譴責一下。

相關文章