中文排版需求 ¶
约 2220 个字 预计阅读时间 7 分钟
Abstract
w3c 标准文档 Requirements for Chinese Text Layout 中文排版需求的精简、整理。
这个文档整理了中文(汉字)书写系统于排版上的需求。是相对比较完整、需要遵循的规范。
由于并不常使用直排形式,所以本文只整理有关横排的部分。
标点符号及其排版 ¶
标点符号的字形、尺寸与字面分布 ¶
- 点号,占一个字宽,港台位于字面正中,大陆位于文字末端,字面始端偏底端(即左下角)
- 夹注号(包括引号、括号、双书名号等
) ,位于文本两侧,占一个字宽 - 省略号、破折号位于字面正中,占两个字宽,不可分行断开
- 连接号位于字面正中,占一个字宽,甲式连接号(–)在横排时直线长度应稍小于汉字一
- 间隔号位于字面正中,占一个字宽,为了节省排版空间紧凑排列可以使用半个字宽
行首行尾禁则 ¶
分为四种级别的行首行尾禁则(避头尾规则
- 不处理
- 完全不处理行首行尾禁则
- 基本处理
- 点号、结束引号、结束括号、结束书名号、连接号、间隔号、分隔号不能出现在一行开头
- 开始引号、开始括号、开始书名号等不能出现在一行结尾
- 是最推荐的做法
- GB 法
- 在基本处理的基础上增加
- 分隔号不能出现在一行结尾
- 严格处理
- 在 GB 法基础上增加
- 破折号、省略号不能出现在一行开头
且处理禁则前要先按照排版风格进行标点宽度的调整。
进行禁则处理时应遵守“先挤进,后推出”原则。
原则上一份文档内的级别应该统一,但特殊情况可以特殊处理。且行首行尾禁则属于排版风格,用户可以自定义更适合的禁则。
符号分离禁则 ¶
- 标点符号
- 以下标点符号占两个字宽,视为一个字符存在,不能为了适配而拆成两行:
- 乙式括号和破折号
- 省略号
- 以下标点符号占两个字宽,视为一个字符存在,不能为了适配而拆成两行:
- 数字及其相应的前后缀单位符号
标点符号的宽度调整 ¶
- 调整空间分类:
- 不可调整:半宽标点、港台式问号叹号
- 可调整:
- 字面左侧
: “ 《 ( 『 「 等 - 字面右侧:,。、:;?
! “》 ) 』 」等 - 字面左右两侧:港台式居中点号
- 字面左侧
- 连续标点符号调整
- 当夹注符号与其他符号连续排列或夹注符号重复出现时都应该进行调整,使文字体裁更加紧凑易读
- 调整:两个相邻标点占 2 个字宽,则缩减成 1.5 字宽;也允许进一步调整为 1 个字宽
- 挤压方向:让开始、结束夹注号紧靠被夹注的内容
- 行首行尾标点挤压
- 若行首出现开始夹注号,则缩减左侧半个字宽的空白
- 原本占一个字宽的标点出现在行尾时应该缩减右侧半个字宽的空白
行尾点号悬挂 ¶
- 绝大多数的中文出版物没有悬挂行尾点号的惯例
- 点号悬挂是行首标点禁则处理方式的延伸,可以避免文字及点号在前后行的移动,甚而导致前行字距不一的问题
- 通常,行尾只可悬挂一个点号
- 若点号(顿号、逗号或句号)将出现于行首,可将其置于前一行的行尾端、突出版心
附:标点符号分类、用法 ¶
点号 ¶
-
句号、逗号、顿号
- 句号 U+3002 IDEOGRAPHIC FULL STOP(
。 )语句结束 - 逗号 U+FF0C FULLWIDTH COMMA(
, )语气停顿 - 顿号 U+3001 IDEOGRAPHIC COMMA(
、 )并列连用
科技文献中句号
科技文献中句号多使用 U+FF0E FULLWIDTH FULL STOP(
. )来代替,避免同 o、0 混淆 - 句号 U+3002 IDEOGRAPHIC FULL STOP(
-
冒号、分号
- 冒号 U+FF1A FULLWIDTH COLON(
: )引述语句开始 - 分号 U+FF1B FULLWIDTH SEMICOLON(
; )语句间意义转折
- 冒号 U+FF1A FULLWIDTH COLON(
-
叹号、问号
- 叹号 U+FF01 FULLWIDTH EXCLAMATION MARK(
! ) - 问号 U+FF1F FULLWIDTH QUESTION MARK(
? )
叹问号叠加
当语气同时具备强烈的疑问与感叹时,可于问号后加上叹号(?!
) ,也有在叹号后加问号的用法
在语气加重时也可以叠用问号或叹号,最多三个两个叹问号连用占一个字位置,三个叠用占两个字位置
可视字体情况使用 U+2047 DOUBLE QUESTION MARK(
⁇ ) 、U+203C DOUBLE EXCLAMATION MARK(‼ ) 、U+2048 QUESTION EXCLAMATION MARK(⁈) 、U+2049 EXCLAMATION QUESTION MARK(⁉)等符号 - 叹号 U+FF01 FULLWIDTH EXCLAMATION MARK(
标号 ¶
- 引号
- 强调字词,作为引用话语、文献的起讫边界
- 属于夹注号
- 台湾
- 先单、后双,使用直角引号
- 开始单直角引号 U+300C LEFT CORNER BRACKET
( 「) - 结束单直角引号 U+300D RIGHT CORNER BRACKET(
」 ) - 开始双直角引号 U+300E LEFT WHITE CORNER BRACKET
( 『) - 结束双直角引号 U+300F RIGHT WHITE CORNER BRACKET(
』 )
- 大陆
- 先双、后单,横排用弯引号,直排用直角引号
- 开始双弯引号 U+201C LEFT DOUBLE QUOTATION MARK(“)
- 开始单弯引号 U+2018 LEFT SINGLE QUOTATION MARK(‘)
- 结束双弯引号 U+201D RIGHT DOUBLE QUOTATION MARK(”)
- 结束单弯引号 U+2019 RIGHT SINGLE QUOTATION MARK(’)
- 引文不止一段,应在每段开头使用开始引号,只在最后一段末尾使用结束引号
- Unicode 编码中有旋转后的直角引号,但不适宜直接使用
- 括号
- 行内注释、说明
- 属于夹注号
- 甲式
- U+FF08 FULLWIDTH LEFT PARENTHESIS [(]
- U+FF09 FULLWIDTH RIGHT PARENTHESIS [)]
- 乙式
- U+2E3A TWO-EM DASH(⸺)
- 或两个 U+2014 EM DASH(—)
- 前后构成一对
- 其余还有【
】 〖〗 〔〕 [] {}等,均为全宽
- 破折号
- 语气或声音的延续、语意的转换或行文的补充
- 呈现上为一条位于字面正中的直线,占两个字宽
- 推荐使用 U+2E3A TWO-EM DASH(⸺)
- 通常也使用两个连续的 U+2014 EM DASH(—)
- 省略号 / 删节号
- 节略原文、语句未完或语气的不连续
- 呈现上占两个字宽,包含六个省略点且在水平、垂直方向均位于字面正中
- 通常使用两个连续的 U+2026 HORIZONTAL ELLIPSIS(…)实现
- 也推荐使用两个 U+22EF MIDLINE HORIZONTAL ELLIPSIS(⋯)保证居中
- 着重号
- 表示相应文本的强调、着重语气或避免歧义
- 形态为标注于文字底端或顶端的圆形中黑点
- U+25CF BLACK CIRCLE(●)或 U+2022 BULLET(•)
- 连接号
- 用于连结时空起讫或数量多寡等
- 台湾
- 甲式:U+2013 EN DASH(–)
- 乙式:U+FF5E FULLWIDTH TILDE(~)或 U+007E TILDE(~)
- 大陆
- 短横线:U+2013 EN DASH(–
) ,实际规定为半字宽 - 一字线:U+2014 EM DASH(—)
- 浪纹线:U+FF5E FULLWIDTH TILDE(~)
- 短横线:U+2013 EN DASH(–
- 间隔号
- 标示某些相关联成分之间的分界
- U+00B7 MIDDLE DOT(·)
- 在台湾占一个字宽,在大陆占半个字宽
- 不推荐使用 U+FF0E FULLWIDTH FULL STOP(
. ) 、U+2027 HYPHENATION POINT(‧) 、U+2022 BULLET(•) 、U+30FB KATAKANA MIDDLE DOT(・)
- 书名号
- 用于标示书名、篇名、歌曲名、影剧名、文件名、字画名等各种作品名称
- 台湾
- 甲式:波浪底线 U+FE4F WAVY LOW LINE(﹏
) ,相邻书名号间需分离开 - 乙式:
- U+300A LEFT DOUBLE ANGLE BRACKET
( 《)与 U+300B RIGHT DOUBLE ANGLE BRACKET(》 )用于标示书名 - U+3008 LEFT ANGLE BRACKET
( 〈)与 U+3009 RIGHT ANGLE BRACKET(〉 )用于标示篇名
- U+300A LEFT DOUBLE ANGLE BRACKET
- 甲式:波浪底线 U+FE4F WAVY LOW LINE(﹏
- 大陆
- 无论书名、篇章名都使用双书名号
- 书名号中还需要书名号时里面一层使用单书名号
- 乙式书名号属于夹注号
- 专名号
- 标示专有名词底端的符号
- U+FF3F FULLWIDTH LOW LINE(_)
- 同甲式书名号,专名号已甚少出现于现代书籍,但仍可见于教科书或古籍的标示
- 分隔号
- 标示诗的分行、音节节拍及相关文字的分隔
- U+002F SOLIDUS(/
) 、U+FF0F FULLWIDTH SOLIDUS(/)
中西文混排处理 ¶
- 应避免使用全角 ASCII 字符
- 中西混排,正文是中文,所以原则上使用中文标点,遵守中文标点的习惯用法
- 公式较多的科学技术中文排版可以统一使用西文句号 U+002E FULL STOP(.
) 、西文省略号 U+2026 HORIZONTAL ELLIPSIS(…) ,字面分布按西文习惯
- 公式较多的科学技术中文排版可以统一使用西文句号 U+002E FULL STOP(.
- 横排时,西文使用比例字体,阿拉伯数字常用比例字体或等宽字体
- 原则上汉字与西文字母、数字之间使用不多于四分之一汉字宽的字距或空包。但西文出现在行首行尾时无须加空白
- 也可以使用西文词间空格 U+0020 SPACE(
) ,其宽度随不同字体也有变化
- 也可以使用西文词间空格 U+0020 SPACE(
- 西文单字词可以使用连字符来跨行,其余情况不得分为两行
- 必须断行时可以不遵照西文从音节断行的惯例,可以强制断行来确保行尾对齐
- 行内包含西文时多使用均排来处理
- 各西文词组间、阿拉伯数字之间的空格、西文字母与阿拉伯数字之间不使用均排
- 只调整汉字、汉字与西文间的字距和空白
最后更新:
2022年12月16日 23:57:19
创建日期: 2022年12月16日 23:57:19
创建日期: 2022年12月16日 23:57:19