有關破折號該用什麼字元來表示的問題
看到 Wiwi 的文章〈為什麼你的破折號——會斷掉〉裡說:
於是我跑去 Unicode Explorer 研究了一下。發現原來我一直以來用的都是 em dash(英文的長破折號,U+2014),但教育部網站用的是 box drawings light horizontal(用來畫表格的細橫線,U+2500)。
聽起來很合理,但真的是這樣嗎?可以用我的部落格響應 BlogBlog 同樂會第一期的兩篇文章來驗證一下我「推坑」的東西有沒有用!
我的「我覺得……很好」第一篇是〈我覺得維基百科很好〉。我們來看看維基百科「破折號」的條目是怎麼說的:
〈我覺得維基百科很好〉裡也提到了可以從維基百科的可靠來源順藤摸瓜。如果點進去維基百科這段文字的來源,可以看到 W3C 的規格書確切來說是怎麼說的:W3C《中文排版需求書》規定,破折號可用兩條U+2014 — EM DASH(顯示如「——」)表示,也可用U+2E3A ⸺ TWO-EM DASH表示。[3]
破折號表示語氣或聲音的延續、語意的轉換或行文的補充。呈現上為一條在水平和垂直方向均位於字面正中的直線,占兩個漢字空間。推薦使用占兩個漢字寬度的U+2E3A TWO-EM DASH [⸺],但通常也使用兩個連續的U+2014 EM DASH [—]來實現。
接下來,我的「我覺得……很好」系列第六篇是〈我覺得《萬國碼標準》很好〉。查閱一下萬國碼標準的規格書,可以發現他在 6.2.4 Dashes and Hyphens 這個章節是這樣說的:
An extra-wide dash in contemporary Chinese typography, referred to as 破折號 (pòzhéhào), is used to indicate an abrupt change of thought, the insertion of new content, or the continuation of tone or sound. That wide dash is often represented with a sequence of two U+2014 — EM DASH characters, but modern practice is transitioning to the use of U+2E3A TWO-EM DASH, instead, which behaves better typographically than the sequence of em dashes.
結論:萬國碼與 W3C 的指引是一致的:用兩個 em dash 是可以的。也可以用 U+2E3A two-em dash,這樣更好,就不會發生中間斷掉的問題。
難道教育部的網站錯了嗎?這不是不可能,畢竟⸺這只是我個人感覺⸺教育部應該只管字的長相,編碼大概是歸數位發展部管的。至少就語意上來說,two-em dash 是比較合理的。(稍微查了一下,教育部《重訂標點符號手冊》網頁上的修訂日期是民國九十七年,two-em dash 要等到二〇一二年才編入 Unicode。)