首页 -> 2007年第9期

汉语现行盲文双音节同音词简写的研究

作者:钟经华



  摘 要 双音节词占现代汉语词汇的绝对多数,现行盲文混淆词也主要是双音节词。对现行盲文双音节同音词进行简写能够提高盲文的阅读、书写速度,能够区分同音词。本研究在5,000常用词内筛选出需要简写的同音词39组,首音节必须标调的同音词4组,极高频同音词9组,四字同调词10组,其他高频同音词16组。本研究中,57个词是通过约定标调方式进行简写的,10个词是通过加一方(第23点)进行简写的。
  关键词 简写 双音节 同音词 盲文
  分类号G761.2
  
  1问题的提出
  
  由于受到触觉感知速度的限制和盲文点字结构的局限性,阅读速度慢是各种语言盲文的共同特点。为了提高阅读书写速度,世界上大多数语言的盲文都有简写方案。通过简写可以减少盲文表达的方数,间接提高盲文的阅读、书写速度。简写能够使盲文表达的信息密度增大。如果未简写100方表达的信息量,简写后只用80方就能够表达,那么,在盲人手指实际阅读速度不变的情况下,获得该信息的速度就提高了20%。这个速度的提高对盲人的意义是非常大的,书写速度也随之提高。汉语盲文和其他语言的盲文一样,也需要简写。我国盲人也渴望提高阅读、书写速度。在信息时代的今天,我国盲人也需要快捷的、准确的处理信息。
  由于汉语盲文仅表示汉语的读音,没有表示词义,没有表示字形,同音词同形就成了汉语盲文特有的问题。现行盲文标调无客观准则,因人而异,所有同音的词(不论同调与否)都可能同形。为了节省篇幅,实际使用中只有大约5%的词标了调[1]。同音词的读音和词义需要根据上下文猜测,这是现行盲文的先天缺陷。黄乃先生[2]指出:“要提高盲字的素质,还必须解决靠上下文‘猜谜’的问题。要严格区分同音词,并设法同表义的汉字沟通起来”。因此,探索同音词混淆的规律,区分同音词是盲文改革的一项重要的任务。
  简写是区分同音词的有效途径之一[3],通过简写可以使同音词组中的高频词的符号得到简化,与未被简写的低频同音词异形,从而有效的区分同音词。现代汉语词汇的重要特征之一是双音节词占绝对优势,占《现代汉语词典》收录词条总数的67.625%[4]。通过简写双音节同音词中的高频常用词,可以提高整体简写效益,同时区别了高频词与其它同音词的盲文符号。对于多个同音词组,还可以规定第二高频词、第三高频词的简写符号。使同音词中的常用词与非常用词异形、不同的常用词异形,在常用词范围内达到区分同音词的目的。
  汉语盲文一直没有系统的简写方案,本研究成果可以作为现行盲文简写方案的一部分。在5000常用字范围内,解决常用同音词同形的问题,解决现行盲文读音和词义猜谜问题。可以使盲人的阅读和书写速度得到相应的提高,扩大盲人的信息量,使盲人在信息方面与明眼人更接近平等。
  本课题研究对弥补现行盲文的缺陷,对提高其科学性有根本性的贡献。简写是盲文由落后向先进发展的重要标志。对我国盲文跻身世界先进盲文之列,提高汉语盲文的国际地位,发展盲人先进文化有积极的意义。
  
  2研究方法
  
  本研究主要采用了文献法。主要文献是《现代汉语通用平衡语料库》[5],该语料库按照通用性、描汉语现行盲文双音节同音词简写的研究/钟经华述性、实用性等原则系统地抽样选择了1919-1992年的现代汉语语言材料7000万字,由人文与社会科学、自然科学及综合三个大类约40个小类组成。语料库定位为系统型语料库,1993年后每年增补350万字的新语料,核心语料在筛选上突出1977年以后的新语料。它主要服务于语言文字的信息处理、语言文字规范标准的制订、语言文字的学术研究、语文教学和语言文字的社会应用等方面。
  本研究的另一个主要文献是《现代汉语词典》(第5版)[6]。
  
  
  
  3研究结果
  
  通过使用《现代汉语通用平衡语料库》,筛选出5000常用词内的同音词组47组。针对上面筛选出的常用同音词组,使用《现代汉语词典》查阅他们的词性和义项,将没有必要区分的异形词4组剔除。盲文中因特殊的分词写法已经区分了的4组剔除。对其余的39组同音词分类进行简写设计。
  3.1首音节必须标调同音词组的简写
  现行盲文方案的拼法规则第三条明确要求“zh、ch、sh、r、z、c、s可以自成音节,以声调符号与韵母界音”[7]。这条规则在实践中执行的并不理想,有关盲文易混淆词的调查[8]发现,“植物/职务/猪/住”和“十五/树/书/数”被老师和学生列为易混淆词,它们包含了双音节词和单音节词的混淆,这是不应该出现的混淆。这类混淆不能归为现行盲文的缺陷。
  为了重申拼法规则第三条,强化自成音节的声母后连写自成音节韵母时,必须在声母后标声调,区分音节界限。在需要进行简写的同音词中,将该类词列为首音节必须标调的词,即便是简写符号也不能省略或者简化掉首音节的声调。
  表中“频率”是指通用平衡语料库中该词的使用频率。表1中同音词组的简写是通过固定标调方式进行的。由于首音节必须标调,同音词的区分需要尾音节完成。为了提高简写的总体效益,高频词尾音节固定不标调,每组同音词中的低频词的尾音节固定标调。这样,低频词没有简写符号,必须使用全拼,高频词的简写符号比全拼节省1方。这种简写方式得到认可后,应当看作一个整体,作者要理解、记忆、应用这种通过固定标调方式的简写符号,而不能将其中的声调符号根据自己的需要变动。
  3.2极高频同音词组的简写
  极高频同音词组是指至少有一个词是通用平衡语料库中前1000个高频词内的词。由于这些词的使用频率极高,对其进行充分的简写,将会极大的提高整体简写。在极高频词的某个符号前加第23点,形成这个极高频词的简写。由于这种简写是由被简写的声或(和)韵母与外来符号(23)构成的,与全拼法的原符号相差很大,由原来的5-6方简化为2-3方,组内的低频词无论作者怎样标调,都不会与它混淆,因此,低频词可以都不标调,也可以作者根据需要标调。表2中没有统一给出简写符号的低频词不必专门记忆其拼写方式。
  3.3四字同调词组的简写
  四字同调词组是指构成同音词组的四个音节的声调完全相同。由于具有这样一个鲜明的特点,有利于这类同音词组简写符号的记忆。在每组同音词内,只在低频词的一个音节上标调,首选第一个音节。如果两个词的第一个字相同,则在第二个音节上标调。因为简写符号的声韵母与全拼法相同,记忆难度很小。但是,每个词的标调方式都应当记忆。“高频词不标调”在一定程度上可以帮助记忆,但是,不是每个词组内的高频词都可以由直觉判断出来。并且,使用频率与语料库的基础语料有关系,还会随着时代变化。
  有些同音词组从逻辑上具有以上几个表的属性,则只列入最前面的表。例如:“事物/事务”首音节后必须标调,同时是极高频词组,则只列入表1。“医生/一生”既是极高频词组,又是四字同调,只列入表2。
  3.4其他双音节高频同音词的简写
  不具有上述三个表的属性的高频同音词组,全部归为一类。这些同音词组的简写与表3的简写类似。首选低频词的第一个音节标调,如果两个词的第一个字相同,则在低频词的第二个音节上标调。
  凡是被简写的高频同音词都实现了词与盲文符号的一一对应,简写符号的意义和读音都是唯一确定的,尽管有些简写符号表面上没有声调。表1、3、4种简写符号的标调方式是固定的,作者完全失去了根据需要标调的自由。简写符号不仅自身有固定读音和词义,他们在句子中还像固定的支点,对于理解无固定读音和词义的非简写符号也有帮助作用,可以更好的理解句义[9]。
  同音词组的简写以区分他们的符号,明确他们的词义和读音,减少词义混淆为首要任务,以减少表达方数为第二位的任务。词义十分相近的同音词,或者异形词没有必要区分,将它们混淆基本上不影响对语言的理解。在5000常用词范围内有:“成分/成份”、“其他/其它”、“想象/想像”、“做法/作法”等。
  盲文中由于特定的分词规则,同音词组中的一个不连写,这也使得它与另一个同音词自然区分开了。在5000常用词范围内,“要是/钥匙”、“正是/正式”、“及其/极其”、“分之/分支”等四组同音词没有进行简写区分,带阴影的词在盲文中分写、中间空一方。
  
  4同音词简写应用举例
  
  
  本研究中的同音词与其他词连写形成多音节词时,其简写符号都可以使用,但是应当分词。当然,单音节简写的规则也适用于这些双音节高频同音词的简写。例如:“功夫”、“绝不”,其中“u”的省略是单音节简写的规则自然生成的[10]。
  应当看到,在5000高频词以外,还有很多常用的同音词。例如:“中点/终点”、“报道/报到”、“妇人/富人”等等,更大范围的同音词组的简写与区分还需要进一步的研究。
  参考文献
  127黄乃. 建设有中国特色的汉语盲文. 北京:中国社会出版社,1999.97;123;10
  39钟经华. 简写是汉语盲文升级的必由之路. 中国特殊教育,2005,11:37-41
  4周荐.词汇学词典学研究. 北京:商务印书馆,2004.366
  5教育部语言文字应用研究所. 现代汉语通用平衡语料库. 2006.10
  6中国社会科学院语言研究所词典编写室.现代汉语词典.第5版.北京:商务印书馆,2005
  8钟经华. 现行盲文同音词混淆问题的调查. 中国特殊教育,2006,11:49-53
  10钟经华,韩萍,李伟洪等. 汉语现行盲文单音节的简写研究. 中国特殊教育,2007,7:36-41
  (责任编校:周耿)