- 轉換規則根據現代漢語制定,兼顧少量文言詞彙。
- 對簡體(zh-hans)與大陸簡體(zh-cn)做進一步細化區分。目前維基百科等大多數項目均採用大陸簡體而虛化簡體,簡體僅用於維基文庫,而維基文庫文言居多,更注重用字原貌。因此簡體轉換僅以《通用規範漢字表》與《現代漢語詞典》(第6版)為依照,並力求轉換精細化,除此之外各地之間的詞形習慣差異均轉交大陸簡體(含馬新簡體)處理。
- 例1:「着」與「著」(助詞義)之繁簡關係未見於規範漢字表,且《現漢》承認「著」為「着」之舊時用法,因此「著」在簡體下不轉換,以體現原文用字,而在大陸簡體、馬新簡體下轉換為「着」。
- 例2:《現漢》承認「馀」為「餘」之簡化字,但大陸日常均用「余」,因此「餘」在簡體下轉換為「馀」,以方便文言閱讀,而在大陸簡體、馬新簡體下轉換為「余」。
- 中國大陸、新馬用字以《通用規範漢字表》、《現代漢語詞典》(第6版)為基準,並參考民間習慣略作調整。
- 台灣用字以政府機構與媒體用字為基準,並參考民間習慣與《常用國字標準字體表》略作調整。
- 港澳用字以政府機構與媒體用字為基準,並參考民間習慣與《常用字字形表》略作調整。
- 由於除Windows 8外其餘主流作業系統對中日韓統一表意文字擴展平面支援較差,故繁簡轉換暫時僅限於中日韓統一表意文字擴展區B及以前字符。之後字符轉換規則待相關技術成熟後再行加入。
- 異體字往往涉及文言及地名人名,故對其轉換持審慎態度。簡體下以《通用規範漢字表》所列異體字為綱,並剔除古字死字及人名地名常用異體字,表外異體字一律不作轉換。繁體下除非日常必要,一律不作轉換。
- 對全域地區詞轉換持審慎態度,以術語和外來語轉換為主。生活用語除非必要,不做轉換。可能導致過度轉換的詞語均不加入。
- 中國大陸地區詞轉換以《現代漢語詞典》(第6版)及官方術語表為基準,同時兼顧媒體和民間習慣。
- 台灣地區詞轉換以官方術語表、政府機構與媒體用語為基準,同時兼顧民間習慣,並參考《教育部重編國語辭典修訂本》、《教育部國語辭典簡編本》略作調整。
- 香港地區詞轉換以官方術語表、政府機構與媒體用語為基準,同時兼顧民間習慣。
- 由於港澳之間用語差異極微,澳門不設獨立全域地區詞轉換表,一律回溯至香港轉換表,少數特例透過本地全局轉換表解決。
- 由於新加坡與中國大陸之間正式用語差異極微,生活用語亦無必要轉換,而馬來西亞由於無官方中文機構,用字用語混亂。故不再設立新馬全域地區詞轉換表,一律回溯至中國大陸轉換表,少數特例透過本地全局轉換表解決。
(轉換表修訂過程中參考了內木一郎(李小狼)的字詞分工表、簡正轉換別字表等論述,謹致謝忱。)