- 转换规则根据现代汉语制定,兼顾少量文言词汇。
- 对简体(zh-hans)与大陆简体(zh-cn)做进一步细化区分。目前维基百科等大多数项目均采用大陆简体而虚化简体,简体仅用于维基文库,而维基文库文言居多,更注重用字原貌。因此简体转换仅以《通用规范汉字表》与《现代汉语词典》(第6版)为依照,并力求转换精细化,除此之外各地之间的词形习惯差异均转交大陆简体(含马新简体)处理。
- 例1:「着」与「著」(助词义)之繁简关系未见于规范汉字表,且《现汉》承认「著」为「着」之旧时用法,因此「著」在简体下不转换,以体现原文用字,而在大陆简体、马新简体下转换为「着」。
- 例2:《现汉》承认「馀」为「餘」之简化字,但大陆日常均用「余」,因此「餘」在简体下转换为「馀」,以方便文言阅读,而在大陆简体、马新简体下转换为「余」。
- 中国大陆、新马用字以《通用规范汉字表》、《现代汉语词典》(第6版)为基准,并参考民间习惯略作调整。
- 台湾用字以政府机构与媒体用字为基准,并参考民间习惯与《常用国字标准字体表》略作调整。
- 港澳用字以政府机构与媒体用字为基准,并参考民间习惯与《常用字字形表》略作调整。
- 由于除Windows 8外其余主流操作系统对中日韩统一表意文字扩展平面支持较差,故繁简转换暂时仅限于中日韓統一表意文字擴展區B及以前字符。之后字符转换规则待相关技术成熟后再行加入。
- 异体字往往涉及文言及地名人名,故对其转换持审慎态度。简体下以《通用规范汉字表》所列异体字为纲,并剔除古字死字及人名地名常用异体字,表外异体字一律不作转换。繁体下除非日常必要,一律不作转换。
- 对全域地区词转换持审慎态度,以术语和外来语转换为主。生活用语除非必要,不做转换。可能导致过度转换的词语均不加入。
- 中国大陆地区词转换以《现代汉语词典》(第6版)及官方术语表为基准,同时兼顾媒体和民间习惯。
- 台湾地区词转换以官方术语表、政府机构与媒体用语为基准,同时兼顾民间习惯,并参考《教育部重編國語辭典修訂本》、《教育部國語辭典簡編本》略作调整。
- 香港地区词转换以官方术语表、政府机构与媒体用语为基准,同时兼顾民间习惯。
- 由于港澳之间用语差异极微,澳门不设独立全域地区词转换表,一律回溯至香港转换表,少数特例通过本地全局转换表解决。
- 由于新加坡与中国大陆之间正式用语差异极微,生活用语亦无必要转换,而马来西亚由于无官方中文机构,用字用语混乱。故不再设立新马全域地区词转换表,一律回溯至中国大陆转换表,少数特例通过本地全局转换表解决。
(轉換表修訂過程中參考了内木一郎(李小狼)的字詞分工表、簡正轉換別字表等論述,謹致謝忱。)