中文語料庫 沒有類似https://www.english-corpora.org/裡的 A/B compare的好用的

hrdom發表於2024-05-07

BCC 一旦用~,統計,就查不全

CCL 有個“搭配查詢” 但是很不好用,必須指明 詞性 和 詞長/距離,coca裡任意1-4距離,詞性也是任意

搭配查詢,用於查詢(對比)不同動詞前後的共現名詞的頻次差異。例如: 查詢表示式“刷(n,=2)|擦(n,=2)”,表示查詢“刷”和“擦”後面的詞長為2的名詞。兩個動詞後的名詞n是相同的,檢索程式會返回n跟“刷”和“擦”共現時的頻次。檢索結果頁面對“刷n”和“擦n”分兩欄進行對照顯示。點選某個具體的“刷n”或“擦n”例項,系統就執行普通查詢,跳轉到普通查詢結果頁面。

搭配查詢的表示式規範為:word1(pos,=length)|word2(pos,=length) word1和word2代表兩個要比較的目標詞語。在 | 前後,對word1和word2搭配詞的描述是相同的,都是 (pos, =length)格式,其中pos代表搭配詞的詞性,length代表搭配詞的詞長(字數)。

搭配查詢的功能設計比較簡單,還有待進一步完善。

相關文章