讨论:Unicode补完计划
YChao在话题“关于 UAO 说明的错误之处”中的最新留言:13年前
关于 UAO 说明的错误之处
来自 218.169.10.45 12:08 2007年1月11日 (UTC) 取得原作者同意后所撷取的讨论区对话。因为合意使用不具名方式,所以有关原作者的部分使用 *** 来代替。
※ 引述《*** (***)》之銘言: > ※ 引述《*** (***)》之銘言: > > ※ 引述《*** (***)》之銘言: > > > 「Unicode補完計畫」的原理是把大五碼造字區的區位, > > > 和 Unicode 的相關字元作雙向對應, > > > 以達到無須藉著外字集,也能使大五碼文件或檔名使用原先欠缺的漢字。 > > > 第一句話就錯了............ > > 正確的是?(搓手準備用訪客身分改) > 他是把造字區跟unicode區單向對應 > 造字 --> unicode > unicode -/-> 造字 > (這邊沒問題) > 然後把big5區跟unicode中的日文漢字區雙向對應 > 中文 <--> 日文漢字 > (這邊被幹到爆炸,因為這樣變向造出一堆奇怪的日文檔XD)
- 造字区有双向对应。你可以作个实验,在文章里面输入日文假名(属于造字区),然后用Big5存档,拿到只装有中国海字集的电脑(一样属于造字区),可以看得到日文。Unicode补完技术原作者之一是User:But,你可以问他。--Jnlin(讨论) 12:12 2007年1月11日 (UTC)
- 感谢 Jnlin 的说明,我会问问看 UAO 作者,还有回报给上文的原作者的。 --220.129.5.147 03:57 2007年1月12日 (UTC)
- 虽然这个已经是2007年的条目,但有些说明上的问题,想在这里提一下:
- 自从windows操作系统转换至unicode之后,内部的储存和显示都是透过转码表的方式,来相容旧时代的软件(ANSI)与文件。对中文使用者来说,就是CP950的编码。
- 而Big5一直以来都存在字数过少的问题,因此有着各种扩充版本的出现。当然最有名的、也是UAO对应的重点:中国海字集。
- 中国海字集算是一个de facto的使用者造字版本,某种程度也包还了先前的扩充字集如倚天码中的日文假名。但到了unicode的时代,windows内建的编码表并没有特别处理,就直接把big5中使用者造字区,对应到unicode的私有保留区。但实际上,中国海字集收录的造字,已经大多数都收在unicode中,所以UAO这里只是把这些原本是Big5外字的部分,重新对应map到unicode已经存在(收录)的字码上。
- 因为wndows系统字码对应是双向的,所以原先unicode中不存在于Big5的字码,也可以因此对应到扩充版本的外字上。某种程度解决BBS上外字(日文)使用的问题。但也因为是双向的对应,直接将unicode文件以big5储存的话,对没有对应映射(UAO)的使用者来说,拿到的只是一堆无法显示外字集的资料。
- 由于windows系统对于FAT档案系统,为了相容性仍采ANSI编码,中文使用者则是CP950编码。如果与没有安装UAO的使用者交换档案(转换到Big5造字区)时,也会出现档名无法显示(对应回unicode私有保留区)的问题。
- 这些问题的解决方案,自然是把原先有使用外字集的文件,全部经过UAO的对应,存成unicode的编码格式。
- 香港特区造字,因为也收录了部分外字集如倚天码,所以Big5日文假名可以显示,但是与中国海字集不相容。同时因为实务上Big5造字字码空间有限,也不太可能两者并存。
- 当然对非Big5编码的软件显示与输入而言,自然不是UAO所可以解决的。YChao (留言) 2011年6月13日 (一) 16:30 (UTC)
FireFox
对于不是使用系统字码表的软件──例如 Mozilla Firefox 等跨平台浏览器或 Java 软件──补完计划会无效,这些软件需要“个别补完”(例如有些社群版的 Firefox,就有将补完后的字码表编译进去)。—以上留言未签名。
- FireFox自2.0起已内建单向“补完”。-- 210.17.246.210 2007年11月13日 (二) 09:42 (UTC)