W3C 釋出中文排版規範

陳一斌發表於2015-04-01

chinese

瀏覽中文網站的時候,心情往往不會太好,擠在一起的字,忽閃忽閃的小動畫,無處不在的連結,影響著閱讀體驗。就“排版”這件事情而言,無論紙質書,還是中文網路,都遠遠落後於同樣書寫方塊字的日本、韓國。

CatchChat 的 CEO 周楷雯此前跟我感嘆網路上,中文排版規範的缺失。此前他內測新作品,縱版日記 App “小記”,在開發過程發現找不到相關的標準可以參考,結果只好先參考了日文的網路排版規範。

不過,今天早上有名的關於文字設計和視覺文化的網站 Type is Beautiful 發了一條微博說,“W3C‘中文排版規範草稿出爐’。編輯包括特邀專家董福興、陳奕鈞、樑海。”

W3C 是 1994 年由“全球資訊網之父”蒂姆·伯納斯-李發起,於麻省理工學院電腦科學實驗室成立,是 技術領域最具權威和影響力的國際中立性技術標準機。由它所制定的 HTML、XML、CSS 等等。根據 W3C 中國官網,2006 年 W3C 也正式來到中國,在北京航空航天大學成立辦事處,推動新興 Web 標準在國內的推廣、應用。——由 W3C 撰寫的《中文排版規範(草稿)》,是中文網際網路世界對中文網頁排版的權威參考標準。

這份《規範》著重解決中文網路排版的那些不夠標準的問題?可以參考 W3C 的《在 Web 和數字出版中優化文字排版》文件:

  • 分別文字和詞語的邊界;
  • 斷行;
  • 斷字;
  • 對齊和定位;
  • 原始碼格式的空格和縮排;
  • 字母轉換;
  • 字母空格;
  • 段落特性;
  • 首字母樣式;
  • 雙向文字;
  • 基準線;
  • 豎排文字;
  • 豎排文字和橫排文字混排;
  • Ruby 標音;
  • Line Decoration;
  • 著重標記;
  • 字型;
  • 計數器,列表,等等;
  • 筆記,腳註,等等;
  • 頁碼,頁首,等等;
  • 頁面佈局;
  • 其它“文化-規範”問題。

中文排版問題可能要比上述所表明的問題更加複雜。由於歷史發展原因,中文被分成繁體(在港臺地區又稱正體)、簡體兩種書寫規範,標點符號規範也分為兩套,而中國大陸以外的地區還保持豎版排版的古風,若要用一套標準全部相容,這的確是浩繁的工程。

根據 W3C 中國成員吳小倩在“HTML5 中文興趣小組”的郵件列表所釋出的郵件,W3C 中文排版規範(草稿)的撰寫時間將近一年時間。

html5

而根據吳小倩傳送的“中文排版規範編寫計劃和進展”郵件可知,W3C 中文排版規範(草稿)由 2014 年 3 月 5 日開始編撰。根據郵件內容“過去幾個月中,我們非常榮幸邀請到以下的專業人士參與這份規範的編寫”,可見《規範》從籌備到出爐,耗時或者長達一年半。該郵件還表明,W3C 中文排版規範是通過 GitHub 寫作,共同撰寫完成。

特邀專家董福興是臺灣“汪達數位出版所”的創始人,臺灣數字出版的先鋒人物。2014 年 9 月 21 日,他在個人部落格上發表了一篇題為《如果你在乎中文》的文章,闡述中文網頁排版當下所遭遇的問題,以及向網友募捐,籌集資金前往美國加州 Santa Clara 參加 W3C 的年度專家大會 TPAC 2014,以及由 Internet Archive 舉辦的“Books in Browser”研討會,繼續跟進“中文排版規範”的進度,以及通過實際交流的方式,解決中文在網頁排版上遭遇的技術困難。

陳奕鈞的公開資料不多,他開發了名為“漢字標準格式,一個提供漢字網頁排版框架,支援各種印刷效果包括相鄰文字裝飾線跳脫、漢字標音、著重號、標點符號修正、中英文混排間隙、漢字擠壓以及章節調整。根據 GitHub 上的提交記錄,最新修改在 2015 年 3 月 26 日。樑海是知乎上的名人,在字型排印的專題下貢獻了許多高質量的回答,他也參與了這次《規範》的撰寫。

W3C 的《中文排版規範》對於中文網路世界有著重要的意義。它可為將來的創業者、產品開發人員提供一份權威性的參考性檔案,保證中文網頁、中文 App 基本的美感。

然而,不代表 W3C 出具一份《中文排版規範》,中文網際網路世界的排版水平就有所提升。與霍炬一同幫助重建 FT 中文網系統,以及幫助紐約時報中文版設計了資料和資訊架構設計師西喬說,“國內(中文排版)情況糟糕主要是因為對這事不在乎。”大陸地區無論是產品開發者,還是產品使用者,多年來對“排版規範”的無視,才是中文網頁、中文 App 排版質量糟糕的根本原因。

不過,隨著中國網際網路、移動網際網路產業競爭日益激烈,大眾審美意識的增強,產品設計將越來越受重視——這其中就包括了影響基礎閱讀體驗的中文網路排版。國內不少人都注意到這個問題,不約而同開發了相對應的漢字網頁排版框架。除了陳奕鈞開發的外,包括業內有名的前端開發者 Sofish 開發 Typo.css,另一前端工程師 MZhou 開發的 Entry.css,均為靈活、遵循中文排版規範,兼顧閱讀體驗的中文樣式庫。

除此之外,越來越多網站注重中文排版的視覺效果,簡書是其中一例,中文排版美觀、大方,閱讀體驗上佳。創始人林立本身十分注重排版的體驗,曾在《我對深度閱讀、專注寫作和自出版的看法》(連結已失效)寫道:

我們精心設計了這個頁面所選用的字型,以及各種格式的排版。很多人問我,為什麼簡書的正文選用了宋體,標題選用了楷體?確實,中文網際網路中的主流字型是黑體系,但黑體系是偏現代氣息的,而宋體和楷體是具有古老的文化氣息的,更顯優雅,所以簡書採用了宋體和楷體而不是黑體。

另外也不得不提 Type is Beautiful,這大概是國內第一個專注介紹中英文字型、排版知識的網站,網站本身的排版足以成為中文其它網站的教科書。

實際上,從林立的回覆來看,中文網頁排版的美觀與否,與中文字型有很大的關係。西喬說,“我覺得(中文網路排版)的平靜是缺少足夠的中文 WebFont。英文的字型已經有上百種了,算上變體有近千種選擇。所以(英文網頁)表現上完全沒有限制,即使最簡潔的設計,單通過字型的組合已經能夠表現得很好的層次感和設計理念。中文的話,除非花點代價嵌入字型,不然基本是沒什麼選擇。”

WebFont “是一種讓網站能夠使用更多字型的雲服務,當訪問呼叫了此服務的網站時,瀏覽器會自動在後臺下載相應的字型並顯示到網站上,使網站的設計可以不再侷限於乏味的系統預裝字型。”

以中文 WebFont 來看,較為成熟商業化運作的專案,有臺灣的 JustFont,只可惜它在大陸之外。
回過頭來,W3C《中文排版規範》的出爐對於網際網路業界始終是一件意義深遠的事情,這是中文網路排版從 0 到 1 的跨越,而從 1 到 100,則看後來者的努力了。


 

補充:以下是陳奕鈞對愛範兒的回覆,引用部分為提問

W3C 《中文排版規範》是從何時開始起草,誰是主要推動者?

《中文排版規範》從去年三月開始,由 W3C 的吳小倩負責組織,找來了各路的排版專家及開發瀏覽器的程式設計師共同討論,確立了方向後便在 Hackpad 上開設帳號,用共筆的方式討論、撰寫正文,最後才收入GitHub專案中管理。很感謝 Hackpad 這個強大的工具,讓分散各地的我們都能無時差地共同編輯,實時看到彼此熒幕上的修改,避免了許多重覆的工作。

繁體中文的部分源自董福興的《tCLReq》(說是繁體中文,其實整個《中文排版規範》都是“fork”自這分作品),因為某些原因無法作為標準在臺灣推行,董福興便放棄了版權,將其提交給 W3C,成了 CLReq 最初的架構。

你覺得 W3C 《中文排版規範》主要解決中文網路排版的什麼問題?

這裡的“網路”應該改作“全球資訊網”,這才是W3C組織主要管理的核心。

實務上,這分檔案暫時應該解決不了什麼問題。它主要的目的,是將過去出版社裡的美編及排版師傅“口頭”傳授的、可能是 de facto 的排版規則整理起來,好讓新的入門者能有完整、得以參照的“書面”資料;再來,是讓 HTML、CSS 等技術的標準制定人及瀏覽器開發者們,能透過這分檔案知曉中文有什麼排版上的需求尚未被滿足,從而改進;最後,讓內容編輯者可以使用一行 CSS 屬性,實現標點擠壓、漢字標註拼音(我們叫它“行間注”)等目前在網頁上還有困難、但印刷品上已使用多年的效果。

除了網頁、電子郵件外,使用 EPub 格式的電子書最終都能因這分檔案受益。當然,任何傳統媒介的排版,如紙書等,都可以參照《中文排版規範》。

請問一下你的職業是什麼?因何而參與到 W3C《中文排版規範》中去?

我過去幾年一直關注網頁及瀏覽器的文字設計(typography)與排版問題,後來開發了漢字網頁排版框架“漢字標準格式”(Han.css),對這個議題算是小有研究,被真正的專家樑海及小倩拉入編輯《中文排版規範》。

與日文、韓文相比,為何 W3C 的《中文排版規範》直到今年才有草稿出來?

韓文部分我不太清楚,但《日文排版規範》已起草多年,它基於日本相應的國家標準JIS X 4051,這分國家標準最後修訂於 2004 年,W3C 的《日文排版規範》應該也是眾多語言中最早的一分排版相關檔案。

中文方面,如前所述,無論在大陸或臺灣,都沒有相應的國家標準,連參考書目都很少,許多設計師的口頭規則可能都來自日文排版規則(尚在使用漢字的地區中,日本的排版應屬最講究的)。外加中文還有繁、簡二大分支要處理,可能因為這些原因,使得中文的腳步稍慢了些。

有朋友提過,中文 WebFont 的缺乏是中文網頁缺乏表現的原因,你覺得是不是這樣呢?

我認為扯到中文 Web Font 是言之過早了。各個作業系統上,幾乎都沒什麼高質量的中文字型。“全部的西文網頁都用 Helvetica 是設計師太無趣的問題,全部的中文網頁都用中易宋體則是電腦的問題”——我想應該是這個道理。首先應該要求蘋果與微軟等公司在桌面、手機平臺上提供好的中文字型,並改進字型渲染技術。 Google 與 Adobe 合作開發的 Noto Sans CJK/Source Han Sans 是個好的示範和開始,希望未來會有更多種類的平臺預裝字型讓設計師和使用者來選擇,如宋體、楷體等等。

PS:關於網頁的中文排版,推薦大家看董福興的這篇《簡單做好中文排版:十項讓長文章更容易閱讀的原則》。

題圖來自 jonasginter

相關文章