首页 -> 2008年第7期

高职英语教材的易读性研究

作者:龚 兵




  摘要:运用VocabProfilers对国内三套高职教材课文的词类数、字符数和词类—字符比进行了统计分析,并就高职英语大纲词汇量、教材生词量和学生课文实际生词量做了对比分析。结果表明,三套教材的综合教程前两册的A/B级总生词量,平均只占《基本要求》词汇表A/B级总量的17%,而学生课文生词词类—字符比在三套教材中均在19%以上,大大超出了2%的生词比例。
  关键词:词频概貌;教材;词类—字符比;易读性
  
  文本分析在二语习得研究中占有十分重要的地位,其统计结果是语言教师、教材编写者、大纲词表制定者等参考的重要依据。文本分析结果包括文本中的各级词频、词汇分布范围、词类数、字符数以及词类—字符比等。其对外语教学的意义在于预知正常阅读理解需要的词汇量和评估课文的易读性。《高职高专教育英语课程教学基本要求》(以下简称《基本要求》)自1998年试行和2000年正式实施,到现在已近十年,高职英语教材的运用也有近八年的时间。高职英语教材的词汇学习目标是否与《基本要求》大纲词汇要求一致,高职英语教材课文对高职学生来说是否具有易读性,这些问题迄今还没有学者撰文探讨。笔者拟通过运用VocabProfilers软件对目前全国通用的三套高职英语教材的词类—字符比进行统计分析,并调查2006级新生三套教材主课文中的实际生词量,以此对该问题进行探讨。
  
  术语界定及相关研究
  
  (一)词类—字符比(type-token ratio)与易读性(readability)
  VocabProfilers软件用了三个词频表:一是出现频次最高的1000水平的基础词汇表;二是出现频数较高的1001~2000词频表;三是学术词汇表(AWL),文本中出现的其他词被列为表外词(off-list words)。统计软件对文本中的词汇按此四种频率统计词类数和字符数,然后计算每种水平的词汇在文本中所占的比例,即词类—字符比。词类—字符比是指文章里的词类数占文章中字符总数的百分比。词类(type)是指文章中出现的不同单词;字符(token)则指文章中出现的单词总数。比如,在同一篇文章里,“go”出现了going、goes、go、went、gone五种形式,其字符数为5,词类数为1。词类—字符比越高,文本中的词汇越丰富,阅读词汇的宽度和深度要求越高,因此,阅读理解难度越大。词类—字符比计算公式是:词类数÷字符数×100=词类—字符比。这个公式也可用于计算词汇密度(lexical density)。VocabProfilers提供了不同的词汇密度的计算公式:实词词类数÷总词数×100。笔者认为,高职英语词汇大纲中相当比例的虚词仍然是高职学生学习的内容,这是高职学生的实际词汇水平决定的。易读性不仅受实词词类数的影响,也受大量表示语法意义的虚词词类数的影响。因而,笔者没有采纳文本分析结果中词汇密度的数据来分析课文的易读性,而是采用词类—字符比数据。
  易读性是指阅读材料易于理解的程度。影响易读性的因子相当复杂,阅读材料本身就包含了诸多影响其易读性的因素,诸如句长、低频词词类数、语法复杂性、语言内和语言外的信息量等;如果考虑到读者因素,影响因子就更复杂了。Dechant和Smith的《阅读教学心理学》列出的影响易读性的因素就多达16个。词类—字符比是大多数学者认同的重要因素之一。难度较大的文本,其词类—字符比较高,而难度较小的文本则相反。
  通过统计学生课文中的生词词类数,比照该课文的总字符数,可计算出学生生词量在课文中的覆盖率,将教材生词覆盖率与学生课文生词覆盖率进行对比,便可知道教材的易读性。
  (二)相关研究
  教材与学生需求是否相符是教材适用性评估的重要指标之一。词汇作为二语习得的核心内容,教材编写者要考虑多种因素诸如纲内词与超纲词的比率、全套教材总词汇量与大纲词汇量的比例、教材认知词汇和产出词汇的比率,以及每单元中生词词类数与学生的生词数之比等。
  人们一般认为英语教材很好地体现了大纲的要求。事实上,教材词汇量对大纲词汇的覆盖率相当低。人们以为学完《剑桥英语新教程》就可以学到通过PET考试所需要的所有词汇。Cobb采用随机抽样方法,把PET考试大纲词表分成10个取样区间,每个区间连续抽出20个单词,共计200个单词。然后,用这200个词对比剑桥英语教材中的生词表。结果表明,三册书生词量与200个单词的重合率分别为25%、40%和53.5%,其总词汇量不到PET考试大纲词汇表总词汇量的一半。
  钱毓芳和顾群超利用Concordancer和Wordsmith两种软件对《大学英语》修订版课文1~4册进行了易读性分析。在对教材词频的调查中,两位作者发现词汇对大纲的覆盖率较高,容纳了大部分大纲设定的共核词汇。这与Cobb和Nation的结论完全不一致。笔者细读两位作者的文章后发现,文中只有结论,缺乏相关数据和统计方法。因此,该结论有待验证。
  本文考察课文易读性的主要变量是词类—字符比,即教材生词表中的词类数在课文中的覆盖率、学生主课文中的实际生词词类数在课文中的覆盖率。文中的教材生词量是指教材生词表(glossary)所列出的各单元生词总量;学生实际生词量是指教材主课文中学生生词数量。
  
  研究方法
  
  (一)研究问题
  本研究运用VocabProfilers软件,通过计算教材生词表A/B级总量与《基本要求》A/B级词汇总量的差异,分析学生生词词类—字符比和三套教材的生词词类—字符比,借以回答:(1)高职英语教材词汇学习总量与《基本要求》词汇总量有何差异?(2)高职学生课文生词数与教材课文生词表中的生词数在课文中的覆盖率有何差异?高职英语教材是否具有可读性?
  (二)研究工具
  本研究运用VocabProfilers统计教材课文词类—字符比;用SPSS10.0对数据进行描述性统计分析。
  (三)数据采集
  本研究需要采集的数据有:(1)《希望英语》(以下简称《希望》)、《新世纪高职高专英语》(以下简称《世纪》)和《新编实用英语》(简称《实用》)综合教程第一、二册中的A级、B级词汇量。(2)三套教材第一册最后单元主课文的生词词类数与总字符数。(3)学生主课文中的生词词类数。深圳某大学2006级通信2班38名学生参加了主课文词汇测试。
  数据采集方法:(1)让学生用“√”标识主课文中的生词,然后,直接统计每位学生的生词量,如果生词属于同一词类,不重复计算,如style和stylish、color和colorist算一个词类;紧密型合成词算一个词类,如hairstyle。松散型的复合词如hair washer、hair specialist,习语如a fish out of water、fit like a glove等预制词块,尽管它们是构成文本词汇难度的因素,但由于学生无法识别,该软件也无法进行统计。因此,为了保持与该软件分析结果的一致性,本研究也没有进行统计。(2)由于期末考试一般只考大纲范围内的词,本研究只以综合教程中主课文A/B级生词量为统计对象,超纲词、听力、写作部分生词不作统计。
  结果与讨论
  
  (一)教材生词量与《基本要求》词汇量的差距
  为了回答第一个问题,笔者对三套教材第一、二册后面的生词表以及《基本要求》词汇表中的A/B级词汇分别进行了人工统计,然后对两者进行了对比(结果见表1)。
  

[2] [3]