用AI回憶起曾被忘卻的語言
語言是文明的DNA,然而聯合國教科文組織調查資料顯示,全球有七千多種有記錄的語言,超過400種瀕危,兩千種極危。中國語言種類繁多,目前有130 多種語言,有25種語言使用人口已不足千人。
以前的少數民族語言保護是採用田野調查建立起龐大的口語語料庫,儲存了原始聲音檔案和國際音標標註等豐富素材,但工作人員往往只能獲得單語語料,無法有效解讀語義,而且中國國土面積廣闊,田野調查的時間和經費成本非常高,少數民族語言的保護傳承工作道阻且長。
隨著AI技術在千行百業中的深入發展,大家發現AI技術在保護少數民族語言方面有獨特的優勢,研發出的無監督跨語言詞向量演算法+OCR光學智慧識別技術合成的自動生成式“漢語-少數民族語言”辭典成為保護少數民族語言的曙光。下面就讓白洞帶大家瞭解AI究竟是如何保護少數民族語言的吧!
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69983145/viewspace-2941984/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 那迷人的被遺忘的語言:Prolog
- Perl只比Python老了兩年卻被認為過時語言?Python
- 大語言模型的應用探索—AI Agent初探!模型AI
- Java備忘錄《語言特點》Java
- AI語音大牛加入國內AI創企,曾因“政治正確”問題被美大學驅逐AI
- C語言的記憶體分配C語言記憶體
- 容易被遺忘的前端基礎:JavaScript 記憶體詳解前端JavaScript記憶體
- 回憶曾經超越時代的非凡創意:《洛奇Mabinogi》的誕生始末
- 曾經我認為C語言就是個弟弟C語言
- 被遺忘的CSSCSS
- 不管多久,都不要忘記曾經的初心~~
- 那些曾經逝去的記憶
- C語言函式指標與回撥用函式C語言函式指標
- 那些年曾談起的跨域跨域
- DataGPT:一個用自然語言來分析資料的AI AgentGPTAI
- 為何Python會被選用為駭客語言呢?Python
- C語言-記憶體分配C語言記憶體
- CSS被設計為一種“寬容“的語言,卻讓更多人認為它不是程式設計CSS程式設計
- 曾夢想仗劍走天涯,現在卻因Bug想回家,揭秘程式設計師最難忘的那些Bug程式設計師
- 無需數學就能寫AI,MIT提出AI專用程式語言GenAIMIT
- C語言回撥日誌庫的實現C語言
- 因 AI 而設計的語言 LISPAILisp
- Rust語言記憶體管理之妙Rust記憶體
- C語言記憶體對齊C語言記憶體
- 被遺忘權的崩塌:當AI可以通過你的朋友瞭解你AI
- 這個曾經瀕臨被砍的專案,卻被他們0宣發做到兩週百萬註冊
- 「聊聊」被遺忘的時間
- C 語言回撥函式詳解函式
- y騰訊再次申請“敲一敲”商標 曾被“駁回複審”
- 第一次,語言的神經啟用被定位到細胞級
- 簡單的回憶
- 忘了Python關鍵語句?這份備忘錄拯救你的記憶Python
- 圖解Go語言記憶體分配圖解Go記憶體
- Karpathy狂贊AI程式碼神器Cursor,直言回不到3年前無輔助編碼了,卻被指「帶貨」AI
- Findings | 中文預訓練語言模型回顧模型
- 那些被遺忘的Enix遊戲遊戲
- 【C語言】整型在記憶體中的儲存C語言記憶體
- 從函數語言程式設計說起函數程式設計