- 转换规则根据现代汉语制定,兼顾少量文言词汇。
- 对简体(zh-hans)与大陆简体(zh-cn)做进一步细化区分。目前维基百科等大多数项目均采用大陆简体而虚化简体,简体仅用于维基文库,而维基文库文言居多,更注重用字原貌。因此简体转换仅以《通用规范汉字表》与《现代汉语词典》(第6版)为依照,并力求转换精细化,除此之外各地之间的词形习惯差异均转交大陆简体(含马新简体)处理。
- 例1:“着”与“著”(助词义)之繁简关系未见于规范汉字表,且《现汉》承认“著”为“着”之旧时用法,因此“著”在简体下不转换,以体现原文用字,而在大陆简体、马新简体下转换为“着”。
- 例2:《现汉》承认“馀”为“餘”之简化字,但大陆日常均用“余”,因此“餘”在简体下转换为“馀”,以方便文言阅读,而在大陆简体、马新简体下转换为“余”。
- 中国大陆、新马用字以《通用规范汉字表》、《现代汉语词典》(第6版)为基准,并参考民间习惯略作调整。
- 台湾用字以政府机构与媒体用字为基准,并参考民间习惯与《常用国字标准字体表》略作调整。
- 港澳用字以政府机构与媒体用字为基准,并参考民间习惯与《常用字字形表》略作调整。
- 由于除Windows 8外其余主流操作系统对中日韩统一表意文字扩展平面支持较差,故繁简转换暂时仅限于中日韩统一表意文字扩展区B及以前字符。之后字符转换规则待相关技术成熟后再行加入。
- 异体字往往涉及文言及地名人名,故对其转换持审慎态度。简体下以《通用规范汉字表》所列异体字为纲,并剔除古字死字及人名地名常用异体字,表外异体字一律不作转换。繁体下除非日常必要,一律不作转换。
- 对全域地区词转换持审慎态度,以术语和外来语转换为主。生活用语除非必要,不做转换。可能导致过度转换的词语均不加入。
- 中国大陆地区词转换以《现代汉语词典》(第6版)及官方术语表为基准,同时兼顾媒体和民间习惯。
- 台湾地区词转换以官方术语表、政府机构与媒体用语为基准,同时兼顾民间习惯,并参考《教育部重编国语辞典修订本》、《教育部国语辞典简编本》略作调整。
- 香港地区词转换以官方术语表、政府机构与媒体用语为基准,同时兼顾民间习惯。
- 由于港澳之间用语差异极微,澳门不设独立全域地区词转换表,一律回溯至香港转换表,少数特例通过本地全局转换表解决。
- 由于新加坡与中国大陆之间正式用语差异极微,生活用语亦无必要转换,而马来西亚由于无官方中文机构,用字用语混乱。故不再设立新马全域地区词转换表,一律回溯至中国大陆转换表,少数特例通过本地全局转换表解决。
(转换表修订过程中参考了内木一郎(李小狼)的字词分工表、简正转换别字表等论述,谨致谢忱。)