空格

標點符號

空格是行文为防止混淆或有特定用途的空位。古代中文在书写上一般不用标点[1],字与字之间亦无空格。空格通常作特定用途,如每起首须缩入两个字位[2]尊称前要留空一格作挪抬等等。

 
空格
一般标点符号
撇号  '
括号 [ ]  ( )  { }  ⟨ ⟩  ( )
冒号 :
逗号  ,  ،  
顿号
连接号 ‒  –  —  ―    
破折号      ——
省略号  ...      
叹号  !
句号  .
书名号 ‹ ›  « »  《 》  ﹏ ︴
专名号 _  
连字号
连字暨减号 -
问号  ?
引号 ‘ ’  “ ”  ' '  " "  「 」『 』
分号 ;  
斜线 /    
着重号
示亡号  ‌
隐讳号 ×
分字符
间隔号 ·
空格     
一般排版符号
和号 &
星号 *
@ @
井号 #
数字符号
反斜线 \
等号 =
倒感叹号 ¡
倒问号 ¿
乘号 ×
除号 ÷
序数标识 º ª
百分号 %
千分号
万分号
加号减号 + −
正负号负正号 ± ∓
度数符号 °
角分符号    
段落符号  //  
竖线 |    ¦
分节符号 §
参考标记
项目符号
脱字符 ^
波浪号 ~
上横线
下横线 _
虚缺号
剑标 † ‡ ⹋
同上符号
知识产权符号
著作权符号 ©
copyleft
录音著作权符号英语Sound recording copyright symbol
注册商标符号 ®
服务商标
商标符号
货币
国际货币符号 ¤

؋฿¢英语Brazilian cruzeiro$֏ƒ英语Florin sign英语Philippine peso sign£英语Ruble sign英语Indian rupee sign 英语Shekel sign圓 圆 円 元 ¥

特殊排版符号
三星符号英语Asterism (typography)
花型英语Fleuron (typography)
标示号
疑问惊叹号
反讽号英语irony punctuation
菱形
延音线
相关符号
  • 空白字符
其他语言标点符号

欧洲语言

拉丁语族日耳曼语族的语言中,字与字之间以及标点符号与其后的字之间会以空格作间隔。在句号后面,一般以一个空格与其后的字分隔,这种分隔称为“法式分隔”。[3] 有时候在处理文书上,会在句号后以两个空格作间隔,这种分隔称为“英式分隔”。

东亚语言

在东亚语言里,空格运用的程度有异。中文日文比较少在文书上使用空格,而日文会在正式场合里在人名上运用空格,以分隔姓氏名字。在韩文,书写的时候运用大量的空格,称为“隔写法”(韩文:띄어쓰기)。韩文的隔写法有标点符号的作用。比如说“아버지가방에들어가신다.”这个句子会因不同的隔写方式,而有不同的意思:

  • 아버지가 방에 들어가신다.(爸爸进房间去了。)
  • 아버지 가방에 들어가신다.(爸爸进提包里去了。)

中文排版

在使用中文电脑初期,文字处理及网页编辑工具大多改自英文软件,与BIG5编码并不完全兼容;英文ASCII字符编码为1byte、中文BIG5则是2byte,假使边界或断行排版没设置好,不足容纳中文字时会造成该字或整段乱码,因此比照英文排版在各字间加半角空格(多出1byte缓冲)以避开程序错误

及至中文文书和网页编辑软件发展成熟后,不再产生乱码情形,也就无须在字间加空格。少数香港媒体新闻网页直到2010年代初,如香港电台当时还维持早期排版方式[4]

Unicode定义

 
Unicode中的各种空格

Unicode定义了大量空格符号,列表如下:

Unicode定义之空格字符
编码 不换行 用于URL HTML 名称 区域 显示
U+0009 文字制表符(Character Tabulation) 基本拉丁文
ASCII字符0x09
U+0020 空格 基本拉丁文
普通半角空格,同ASCII字符0x20
U+00A0   不换行空格(No-Break Space) Latin-1 Supplement  
同U+0020,但不换行
U+1680 欧甘空格(Ogham Space Mark) 欧甘字母
用于分隔欧甘文单词。通常情况下显示为一条直线,而在没有字干的字体中会显示成空格。需要欧甘文字体。
U+180E 蒙古文元音分隔符(Mongolian Vowel Separator,MVS) 蒙古文
作用近似不换行空格,用于蒙古文时使得词尾两个字母呈现不同的字形。自Unicode 6.3.0起不再定义为空格。
U+2002   En空格(En Space)或Nut 通用标点
en同宽(em之一半)。
U+2003   Em空格(Em Space)或Mutton 通用标点
与em同宽。
U+2004   Em三分之一空格(Three-Per-Em Space)或Thick Space 通用标点
em之三分之一宽
U+2005   Em四分之一空格(Four-Per-Em Space)或Mid Space 通用标点
em之四分之一宽
U+2006 Em六分之一空格(Six-Per-Em Space) 通用标点
em之六分之一宽。电脑字体有时与U+2009等同。
U+2007   数字空格(Figure Space) 通用标点
用于分隔数字之定位符,与单一数字同宽
U+2008 标点空格 通用标点
与同字体之窄标点同宽,即句号或逗号(西方语文)之宽度[5]
U+2009   窄空格(Thin Space) 通用标点
em之六分之一(有时设计成五分之一)宽。建议用作SI单位数字之千位分隔符。与U+2002至U+2008不同,其宽可根据排版调整[6]
U+200A 发宽空格(Hair Space) 通用标点
窄于窄空格(thin space)
U+200B 零宽空格(Zero Width Space,简称“ZWSP”) 通用标点
U+200C ‌ 零宽不连字(Zero Width Non Joiner,简称“ZWNJ”) 通用标点
U+200D ‍ 零宽连字(Zero Width Joiner,简称“ZWJ”) 通用标点
U+202F 窄式不换行空格(Narrow No-Break Space) 通用标点
作用近似U+00A0不换行空格。用于蒙古文时宽度通常为普通空格三分之一,用于其他文字时宽度有时相当于U+2009窄空格。
U+205F 中数学空格(Medium Mathematical Space,简称“MMSP”) 通用标点
用于数学方程式。em之18分之4宽[7]在数学排版领域,空格宽度通常以十八份之几的方式给定;4/18 em可用于数个情况,例如数式a + ba++b之间[8]
U+2060 文字连接符(Word Joiner) 通用标点
同U+200B,但该处不能换行。Unicode 3.2新增,以代替U+FEFF字符废止之零宽不换行空格功能
U+3000 表意文字空格 CJK符号及标点  
与CJK文字同宽(全角
U+FEFF 零宽不换行空格(Zero Width No-Break Space) = 字节顺序记号(Byte Order Mark,简称“BOM”) Arabic Presentation Forms-B 
主要用作字节次序标记字符。原来之不换行指示功能于Unicode 3.2起废止,代之以U+2060。

Unicode在控制图形(Control Pictures)区域亦提供一些具像字符用来代表空格,例如(Symbol For Space,U+2420)、(Blank Symbol,U+2422)和(Open Box,U+2423)[9]。有些文字处理软件如Microsoft Word会使用间隔号·代表半角空格。

注释

  1. ^ 御定康熙字典 (四库全书本)/卷28#读: "又集韵韵㑹 𡘋大透切音豆义同 周礼天官小宰宫正注郑司农读火绝之徐音豆 又增韵句读凡经书成文语绝处谓之句 语未绝而点分之以便诵咏谓之读 今秘省挍书式凡句绝则点于字之旁 读分则微点于字之中闲";可见直到清朝时书写习惯都不加标点,研究解读时才另加标记辅助。
    详见标点符号#历史, 古人书写实物见: 兰亭集序
    《汉典》:句读页面存档备份,存于互联网档案馆
  2. ^ 沿自1919年胡适周作人钱玄同等向中华民国教育部提出《请颁行新式标点符号议案(修正案)》存档副本. [2010-09-30]. (原始内容存档于2009-12-13). [1]页面存档备份,存于互联网档案馆
  3. ^ Einsohn, Amy. Punctuation, Eyeballing every mark. The Copyeditor's Handbook: A Guide for Book Publishing and Corporate Communications 2nd. Berkeley, Los Angeles, London: University of California Press. 2006: 113 [2010-04-25]. ISBN 9780520246881. If you are working on documents that will be printed without any intervention from a compositor (e.g., documents produced on the office laser printer), you will have to carefully scrutinize every piece of punctuation to be sure that the document contains the correct character (see table 5). You should also delete any extra wordspacing before and after punctuation marks. The conventions are: One space follows sentence-ending punctuation mark (period, question mark, or exclamation point). One space follows comma, colon, or semicolon ... 
  4. ^ 天文台明日考慮需否發三號強風信號. 香港电台. 2012-07-21 [2012-07-22]. (原始内容存档于2013-04-30) (中文(香港)). 
  5. ^ Character design standards - space characters. Character design standards. Microsoft. 1998–1999 [2009-05-18]. (原始内容存档于2018-01-09). 
  6. ^ The Unicode Standard 5.0, printed edition, p.205
  7. ^ General Punctuation (PDF). The Unicode Standard 5.1. Unicode Inc. 1991–2008 [2009-05-13]. (原始内容存档 (PDF)于2011-09-17). 
  8. ^ Sargent, Murray III. Unicode Nearly Plain Text Encoding of Mathematics (Version 2). Unicode Technical Note #28. Unicode Inc: 19–20. 2006-08-29 [2009-05-19]. (原始内容存档于2021-03-08). 
  9. ^ Control Pictures (PDF). Unicode, Inc. [2017-03-06]. (原始内容存档 (PDF)于2021-04-20). 

延伸阅读

另见