谷歌要統一字型:思源黑體 困難重重
Google有不少巨集偉的計劃,比如圖書數字化和無人駕駛汽車,而其字型計劃Noto卻鮮有人關注。一般來說,如果系統不支援某種語言,就會顯示一個空白的方框,國外一般將它稱為“豆腐”(Tofu),而Noto就是“No Tofu”的縮寫,旨在統一全世界語言的字型,消滅亂碼。
前不久,Google聯合Adobe推出的泛亞字型——思源黑字,它適用於中文、日文和韓文,就是Google Noto專案的一部分。Google似乎往前邁出了一步,但想要統一字型,還有很多困難。
編碼問題
字型統一計劃最早可追溯到1987年,當時 Unicode 聯盟發起了一項語言字型研究,並在後來推出了Unicode標準,一套支援多語言處理和顯示的字元編碼系統。Unicode 會為每種語言的每一字元提供唯一的編號,稱為碼點(code point)。Google的Noto也與Unicode標準相相容。
Unicode在統一漢字的過程中就遇到過困難,它想為中日韓共用的字元建立一個單一的字元庫,不過當時技術條件不允許,而且碼點很快就用完了,這對想統一世界語言的計劃來說,是一個很大的打擊。而且,即便中日韓的漢字看起來很相近,但他們卻代表了不同的文化模式,有很多細微的差別。統一的字符集會造成拼寫混亂。
不過技術在進步,現在同一字元的變形不必再使用同一編碼,Noto也是第一個真正支援中日韓三國漢字的開源字型。
小語種問題
Noto支援的語言很多,即便是一些瀕臨滅絕的語言,如因紐特語(Inuktitut),也在其射程範圍。這讓很多使用著幾乎被世人遺忘的語言的人感到很欣慰。
Tlingit一種瀕臨滅絕的印第安語言。這種語言還算幸運,因為它使用拉丁字母表進行書字。Noto的拉丁字型就能支援Tlingit,不過也僅僅是部分。許多詞彙要加註變音符號,書字時要加以區別,但Noto現在這方面做的還不夠多。
有趣的是,除了一些快滅絕的語言,Noto還支援一些古怪而有趣的語言字型,比如蕭伯納字母(shavian alphabet),《魔戒》作者托爾金所創制的架空文字。不過被數百萬人使用的另一種印度語Oriya卻不在其中,也讓很多人感到不滿。
字型不能反應文化背景
另一種情況是,即使Noto支援某種語言,其字型也不能準確反應出語言背後的文化。烏爾都語(Urdu)就是一個例子。
nastaliq體的烏爾都語書寫華麗不規則,有很多古老的詩集都是用這種字型寫成,被認為是烏爾都語的精髓,但並不受Noto支援。而naskh 體的烏爾都語則線條分明有規律,編碼起來很簡單,也因此包括在Noto中。這讓很多人感到不滿,因為系統中的文字並不能真正反映當地的使用情況,而不少人在分享相關文字時,也不能直接複製貼上,只能以圖片的形式傳送。
烏爾都語的情況與漢字當時的情況相反,前者是需要多個編碼對應一個字元(有文體區別),而後者是試圖用一個編碼代表多個字元。類似的情況還有中文的草書、行書、楷書等,這都需要更進一步的研究。
Google的字型計劃是一個不斷調整與妥協的過程,要兼職美觀與功能性有很大的難度。不過語言文字是人類社會的重要組成部分,多花一些時間也是值得的。
via npr
相關文章
- Adobe與谷歌推出開源字型“思源黑體”谷歌
- 思源黑體:一款Pan-CJK 開源字型
- 如何把谷歌的「思源黑體」作為Webfont使用?谷歌Web
- Adobe和Google聯合推出開源字型“思源黑體”Go
- 創業之路困難重重 直到遇到了小程式加盟創業
- 運維告警管理困難重重,我是怎麼做到的運維
- 一對一直播平臺困難重重下,營銷之路都有哪些挑戰?
- ApplePay進中國困難重重面臨裝置成本等3個難題APP
- 產品功能 | BI產品替代Excel困難重重?Smartbi幫你全搞定!Excel
- 一些困難題
- 優思學院|推行精益六西格瑪困難重重?7大原因分析助你避坑
- JNPF讓軟體系統的增、刪、改、查不再困難
- 出門困難
- 2022年3月資料庫流行度排行榜 Oracle衛冕之路困難重重資料庫Oracle
- 軟體開發中的十大困難
- Some 困難的數論
- 理論與現實,人工智慧“活著”比你想象要困難人工智慧
- 部署機器學習非常困難,並將一直如此...機器學習
- 《通關!》——助你打通遊戲設計的重重難關遊戲設計
- Kubuntu 專案遭遇困難(轉)Ubuntu
- ctfshow_web_1(困難題)Web
- 一個新手學習PYTHON困難度有多大Python
- 我在安裝第一個軟體mplayer時遇到困難,請大家幫忙!(轉)
- 選擇困難的三點思考
- 3045. 統計前字尾下標對 II(困難)
- 智聯招聘:就業困難大學生群體研究報告就業
- 機臺統一管理有多困難?但現在出現可行的解決方案了!
- 如何解決MES交付困難問題?
- 女生轉行學IT有什麼困難?
- 大資料分析存在哪些困難大資料
- 技術學習選擇的困難
- AI studio開發困難雜記AI
- 免費OA系統快準好解決遠端辦公困難
- 模切ERP系統上線困難的原因是什麼?
- 禁止WordPress使用谷歌字型的方法谷歌
- 安卓應用安全指南六、困難問題安卓
- 攝影軟體“留拍”開發現狀與過程遇到的困難
- leetcode:41. 缺失的第一個正數(困難,陣列)LeetCode陣列