- 語料庫:對語言進行全景性的透視。
- 語料庫思想產生的背景:
- 電腦科技的發展,資訊科技的支援;
- 從現象歸納原理的思考模式
- 語料庫幾個特徵
- 語料庫一定是機讀的,不是為人準備的,因為其統計非常的繁雜,分析非常的繁雜;
- 必須是確認為真的,進入語料庫的語言必須是經過挑選、篩選的
- 是一個有限集合,是一個語言的抽樣
- 代表性和要研究的目的是緊密相關的
- 狹義的語料庫只有文字,廣義的語料庫還有聲音、視訊、手語等多模態語料庫
-
語料庫建設的基本問題。
-
語料一旦確定,很少更新
-
人工參與過多,自動化程度不高
-
缺乏語言資源管理(缺乏網站式的管理工具)
-
缺乏使用者定製功能
-
成本大,週期長
-
語料庫建設網路化(更多的人一起建設)
-
- 語料庫型別
-
可比語料庫(最簡單),由討論一個領域的兩種語料組成。舉例:奧運會翻譯的時候做排球賽事的翻譯,首先要找討論排球的英文文章和中文文章,建立可比語料庫。
-
平行語料庫,對其的文字。篇章對其、段落對其、句對其、亞句對其、詞對其。句對其很重要,句對其的語料庫可以作為翻譯記憶存在。
-
單語語料庫,語料庫只有一種語言,外語單語語料庫庫,藉助於語料檢索與統計分析工具,可以得到遠超詞典和語法書的語用知識。(免費、量大、質高、檢索方便、對翻譯實務可用性較強)
-
按照加工與否,分為熟語料、生語料語料庫
-
按照語料型別,分為通用、專門用途語料庫
-
翻譯學者語料庫,統計口語錯誤、書面錯誤,用於對學習過程的分析的語料庫
-
-
料庫檢索工具:wordsmith(商業)、CWB(sourceforge開源)、spss|weka 統計工具及資料分析工具(商業開源)、基於web的語料庫系統:sketch engine http://corpus.byu.deuhttp://ccl.pku.edu.cn
-
語料庫在翻譯實踐中的用途
-
獲取專業知識、學習專業術語、借鑑表達方法、模仿寫作風格、提供翻譯策略
-
幫助譯者理解原文、幫助譯者尋找更合適的表達方法
-
語料庫學習視訊下載地址:連結:https://pan.baidu.com/s/1XBCCG0cS963cY1wZAU2aDQ 密碼:ew3y
論文學習資料下載地址:連結:https://pan.baidu.com/s/1AHt37NLRQSBfHuNPP-bjBg 密碼:ut9b