理论前沿
责任编辑:吴浩/xdtsjy(sina
国家通用盲文分词连写规则简析
钟经华李婧
【摘要】盲文的分词连写对盲文的本体研究和信息处理等具有重要的理论及应用价值。由于现行盲 文的惯性,语义逻辑被打破、连续零散的单音节等误导读者的分词现象依然大量存在。深入理解与贯彻国家 通用盲文分词连写规则,是从根本上解决这些问题的关键,是推进盲文规范化工作的重中之重。
【关键词】国家通用盲文;规范化;分词连写;整体概念;短词组
【中图分类号】G761
盲文的分词连写对盲文的本体研究和信息处 理等具有重要的理论及应用价值。国家通用盲文分 词连写规则是以“汉语拼音正词法”为蓝本,参考现 行盲文分词连写规则形成的,得到各方面的普遍认 可。在盲文的实践应用中,由于现行盲文的惯性,语 义逻辑被打破、连续零散的单音节等误导读者的分 词现象依然大量存在,这就迫切需要深入理解与贯 彻国家通用盲文分词连写规则,从根本上推进盲文 规范化工作。
国家通用盲文分词连写包括“符合语法”等三 项基本原则,以及“基本以词为书写单位,词的各个 音节连写”“表示一个整体概念的双音节和三音节 结构,连写”“表示一个整体概念的四音节及四音节 以上的结构,按词语或语节分写,不能按词或语节 划分的,全都连写”“单音节词重叠及单音节重叠并 列结构,连写;双音节词重叠,分写”“单音节前附成 分(副、总等)或单音节后附成分(子、儿等)与其他 词语,连写”“意义上结合得较为紧密的短词组,连 写”等六条一般规则。在一般规则中,第四条和第规则的 ,在 义
规则是 性 ,要
_、规则':明确基本书写单位
规则一中提出的“基本以词为书写单位”,意味
写以词为单 ,有
例外;“词的各个音节连写”,则排除了书写单位比 词小的可能。因此,通用盲文的书写单位只能等于 词或者大于词。
在理解使用这一规则时,首先要明确,分词连 写过程由“分词”和“连写”两步组成。所谓“分词”,是 把词与词之间分开,而不是把一个词从内部分开;所 谓“连写”,是把符合连写条件的几个词再连写在一 起。
在具体操作中,以规范汉语词典收录的带词性的 条目为依据,只要是其中收录的带词性的条目,都可 以确定为词(即词典词),一律连写。这些词如果分 写,就违背了 “规则一”,例如“倍伽”“也/罢”“之/所 以”“所/在”等,这些分写都是错误的。但如果不属于 这种情况,就应该分写,例如:表示条件的助词“的话”是词典词,分写是错误的;而表示领属关系的 “的/话”是两个词,分写是正确的。
汉语拼音正词法基本规则同时,可词典也不会穷尽所有词。因此在词典
見代#殊表t基础教肓研究I 17
理论前沿
责任编辑:吴浩/xdtsjy(sina
词之外还可以认定某些词(即认定词),尤其是名词、数词、量词、拟声词等开放性的词,这些词应当连写,如“分钟”作为表示时间的名词时就应当连写。
二、 规则二:正确理解“整体概念”与“结构”
规则二中,“整体概念”是指一个逻辑意义的整 体,“结构”是指几个词构成的词组。空方表示逻辑 停顿,一个逻辑意义的整体内不能有停顿,因此应 当连写。
正规词典中收录但未标明词性的条目,可以视 为表示整体概念的结构,例如~不得不、没关系、到 头来等。有些词典没有收录的,也可以认定为整体 结构,如:越来越、愈来愈等。如果不认可“分钟”为 名词,作为表示时间的整体概念也应连写。
体现整体概念的双音节词有很多,但是词典一 般不收,如:全国、胆小、熟透、走来、尚未等;而体现 整体概念的三音节词用法相对更加固定,如:人世 间、突然间、暗地里、骨子里、私下里、四下里(非名 词方位词词组)等,一时间、一席话、一团糟、一锅 粥、一根筋(非数词量词名词词组)等。多数三音节 整体结构在词典中能够查到。双音节和三音节整体 概念连写,才能体现以语义为基础连写的思想。
三、 规则三:正确处理“熟语”“半熟语”
规则三对汉语中常见的表示一个整体概念的 四音节及四音节以上的结构的盲文书写方法进行 了规定~能够按词语或语节划分的,分写;不能按词 或语节划分的,整个结构连写。所谓“表示一个整体 概念的四音节及四音节以上的结构”,一般指的是 成 等熟 0以 成 成
四字结构等常用的“半熟语”。
(一)除特殊情况外,熟语一般不切分
熟 成 等0其中
丰富的古代汉语句法、词法信息。熟语是常用的、定 型化的、语义结合紧密的特殊词汇单位,是较为明
规■代特殊表t基础教肓研究I18显的表达整体概念的结构,宜作为一个整体进行处 理。很多研究者将熟语称为“现代汉语中词的等价 物”,也就是说其在汉语中基本是与词等价的。
1.成语相当于词,无需分词连写
成语是熟语的主体。在意义上,成语有比喻义、引申义等,难以简单地通过字面来分割、理解;$2]在 结构上,其内部结构已经高度凝练且相对完整,对 它进一步分词不仅困难往往也劳而无功;在用法 上,成语区别于其他语汇的显著特点就是“在现代 汉语中,语法功能相当于词”,那么它自然就无需再 “分词连写”了。
但是,盲文语料库中的成语写法较混乱:四字 格成语全连的占41.86%,二分的占36.30%,三分的 占18.06%,四分的占3.78%;同一个成语存在多种 写法,最多的有四种写法。
在现行盲文中,成语的分词同样也没有体现成 语的结构,而是大多按成语字面义进行拆分,然后 按照普通的规则连写,将成语混同于非成语,把文 言文当作现代文,如“无动于/衷”“擦肩/而/过”“求/之/不得”“马/不停/蹄”“漫/不经心”等。
2. 其他熟语根据情况决定分连
大多数的熟语结构较为完整,由寓言、典故、诗 文语句浓缩而成,其内在语义结构已不明晰,本身 不表达一个简单的概念,而是描述一个复杂的事件 或者说明某种哲理。对这些熟语进行正确拆分需要 深厚、专业的古代及现代汉语知识背景,作为面向 盲文使用者的分词连写规则来说,进行这样的拆分 没有必要也不可能。
同时0 熟 拆 大多
0 为 的点 拆 0会造成很多不符合语法的现象,也可能会造成歧义 或理解上的困难,如“百思/不得/其/解”,“百思”既 不是 成 0 不是 成 。的
理论前沿
责任编辑:吴浩/xdtsjy(sina
有“万变/不离淇/宗”“踏破/铁鞋/无/觅处”等。
但是,对于一些内部结构对称、语节划分清晰 的熟语,可以进行拆分。有些熟语的内部可以分为 对称的相对完整的语节,那么就可以把每个语节视 为不可再分的子结构,每个子结构内部连写,而不 同的语节结构之间分写,如“一不做/二不休”“刀子 嘴/豆腐心"8问/三不知”等。
(二)除特殊情况外,半熟语一律不分写
所谓半熟语,包括准成语、类成语、四字结构 等。四字结构是指由对仗的意义相同、相近或相反 的两个单字及意义关联的两个单字组成的意义关 联紧密、非双语节的整体,如“云开雾散”。类似的四 字结构《现代汉语词典》收录了 34条。
半熟语有一定的凝固性和稳定性,但是比熟语 。如 的 有 以 三
等。现行
有被四分的倾向。
根据通用盲文分词连写规则,除了像“无论/如 何”这样两两成词的以外,四字整体结构8律不分写。
四、规则六:正确处理短词组的连写
个有
的标准。我们建议,对“紧密”要求宜宽,对“短”要求 宜严。单音节最短,并列关系是“紧密”的8种,因 此,不论有几个字,单音节并列的词组,全连写。如 “赤橙黄绿青蓝紫”,这个词组没有符合逻辑的分写 办法,全部分写则会产生大量零散单音节,违背了 基本原则的第三条。
短词组应以单音节为主体,至多包含8个非单 音节,如:种菜、养猪、听懂、揉捏、树上、树上面、树 叶上、中小学、大红花、床底下、屋里面、公元前、8分钟、七棵树、散裂出。类似短词组的语法结构很复 杂,包括动宾、名方、数量、数量名词组,也包括动补、状中、定中结构,这里我们关注的是其意义上有 稍微紧密的联系,而不是内部结构的语法性质。根 据规则,符合这些要求的短词组,应予连写。
如果是有两个以上的双音节,就不能列到“短”的范畴中了。例如I U精彩般了”“糟糕/透了”,“极了”“透了”作为意义紧密的短词组要连写,这既符合现 代汉语的双音节化倾向,也减少了盲文书写中的单 音节。但是,“极了”“透了 ”与前面的双音节词不再构 成“短”词组,不能进8步连写。类似的,“京津冀”要 连写,“北京沃津/河北”要分写;“树叶/上面”“三棵/杏树m i看/二慢/三通过”等分写。但是,“主义”作为 特殊后缀,与词根连写,不受“短”的限制。
同类8致是分词连写的基本标准,如“消除/复 工、复产、复商、复市、复医、复课、复赛/的/隐患”,不 用管词典是否收录,更不用管整体的词性,也不用 管后面单字的词性,七个“复”必须8致。不论是词、双音节结构,还是意义紧密的短词组,都应连写。
国家通用盲文方案保持了我国盲文的稳定,全 面优化了盲文的书写方式,为用盲文准确阅读、规 范书写国家通用语言,适应现代盲人文化和盲文信 息化的需要提供了基础保障。盲文分词连写的规范 化 ,作 作极行动 ,范 国家 分词连写则,加快国家通用盲文的推广普及。®
参考文献:
t1"教育部,国家语委,中国残联.语言文字规 范:国家通用盲文方案[GF0019-2018][M].北京:中国盲文出版社,2018.
[2!3]马志伟,乔永.《汉语拼音正词法基本规 则》解读与成语注音问题研究]].汉语学报,2006 (1).
(作者单位:钟经华,北京联合大学特殊教育学 院,100075;李婧,中国盲文出版社,100050)
見代#殊表t基础教肓研究I 19