2009年4月26日

Unicode 補完計劃


常常發現在 Windows XP 裡會有檔案名字無法顯示其他國語言的狀況,最明顯的是簡體字及日文(韓文我不懂,平時也不常碰,但應該也會有一樣的狀況)

如果檔案想要以簡體字命名,常常到最後就會出現 ??? 的名字,為什麼會如此?這牽扯到了一段電腦界的歷史故事,但,這不在我們討論的範圍,我們要討論的是如何解決這個狀況。

為了解決不同語系之間資訊交流的問題,有一種技術存在,叫做 Unicode。

事實上,Windows NT/2000/XP 的系統核心就是 Unicode。

簡單的說,Unicode 是一個超大的文字庫,它蒐集了世界上所有語言的大部分文字,而收錄在同一個文字庫裡,包括 繁/簡體中文、日文、韓文,以及許多想不到的語文,因為 Windows XP 使用 Unicode 作為核心,所以理論上,Windows XP 應該可以同時處理世界各國的文字,在 Unicode 裡,無論是英文還是漢字、假名,每個字都是兩個 bytes(位元組)

如果用這種方式,就可以讓 Windows 認得各國語言的文字了,很棒吧,而有一群熱心的高手聯合制定了一份類似字集的東西(這樣講比較好懂),就是所謂的 Unicode 補完計劃。

簡單的說,這個套件是用來修改 Windows 裡 BIG5 與 Unicode 之間的對應關係,把 BIG5 的日文假名字碼,對應到 Unicode 的正確日文字碼上,而不是微軟一開始對應到的造字區。

這種做法,跟以往使用造字檔等方法不同,等於直接徹底改進當時微軟沒有承認倚天擴充字集裡日文假名的問題。因為直接把這些假名對應上了 Unicode 的日文部分,所以你不用安裝字型,就可以直接使用 Unicode 的日文字型看到假名。

而且因為他轉成 BIG5 後,還是存在 BIG5 倚天擴充字集的位置,所以你製作的所有文字檔、網頁,或是別人的文字檔、網頁,還是可以沒有問題的交流。

最明顯的差異,就是 Windows 對其他語言檔案名字的支援能力強了很多(不信,拿 Nero 去試試,沒裝 Unicode 補充包前,能不能完整地燒出簡體字的檔案),這也是 Simon 介紹的原因。

Vista 這方面我不太清楚,但 Windows 2000、XP 最好安裝這個補完計劃的程式,對其他國語言的支援能力會比較高些。