首页 -> 2007年第2期

三种国际阅读评价体系给我们的启示

作者:付雪婷

分)
  请你任意组合至少两则材料(上文也可算一则),提取材料中的关键信息,从一个或多个角度思考,谈谈你对母语现状的认识。(60字以上)
  从这组题目整体来看,没有充分体现出命题者对所要考查的阅读核心能力要素全盘性的把握和设计。16小题考查的是理解词语在文中的具体意思,17、18、19小题主要考查学生从文本中获取信息和初步概括的能力。这4道题共8分,仅占整组题目分值的38%;而20、21、22三道试题则相对独立于阅读材料《华语情结》之外,题干内容均与阅读选文的关系不大(只有第22题题干有“上文也可算一则”之语),脱离了阅读材料。从题目的参考答案及评分标准中,很难看到阅读文本的影子和作者在文中所抒发的华语情结,而且题目的考查目标也偏离了阅读的核心能力要素;但从分值比例上看,20、21、22三道小题赋分共13分,占这组阅读测试题目总分值的62%。这样的试题命制得显然不够合理。
  如果命题者没有对所要考查的目标阅读能力要素做出清晰的认定与整体上的把握和设计,那么所命制的题目势必难以反映出学生的真实阅读水平。诚然,阅读理解过程是一个复杂的心智活动过程,从完整而连贯的阅读理解过程中准确离析出每一种阅读能力要素是很困难的,前文也提到过,我国学者对阅读能力要素的划分不下几十种,难以达成一致。例如。章熊认为阅读能力包括认知和筛选的能力、阐释的能力、组合和调整能力、扩展能力。祝新华认为阅读能力包括认读能力、理解能力、吸收能力、速读能力、语感鉴赏能力。各家有各家的道理。然而我们所关心的是,怎样的划分使得基于纸笔测验的阅读能力测试更具可操作性?显然,我们国内的划分很难作为有效的测评框架应用到实际的阅读能力测试中。因为在设计阅读测试题目时,很容易出现题目考查的能力要素不能清晰认定,有的题目考查到了几种能力要素,有的能力要素却难以通过纸笔测验来考查的状况。相比国内,上述国际上的三大评价体系对阅读能力要素趋于一致的认识则更为可取。它们在阅读能力测试之前都将其测试对象具体化、行为化,便于认定和把握,使得命题过程可操作性很强。获取信息、解释文本、反思与评价是完整的阅读心智活动中三种主要的智力动作,三者之间不可避免地有一定的相关性和依赖性,但各自也能保持相对的独立性。在命制阅读测试题目的时候,三者能够较为清晰地区分开,使得每道题目的考查点比较明确,便于测试之后的解释和反馈。
  其次,相比国内主要按照文章体裁来选择阅读测试材料,根据阅读情境或阅读目的来选择测试材料更为合理。这样做主要有两方面的优点:一方面,按照这种标准划分的阅读材料覆盖面更广,不局限于课堂教学中的记叙文、说明文、议论文等,它基本上可以涵盖学生在学校内外的阅读活动中所接触到的所有阅读材料的种类,更贴近学生丰富多彩的阅读生活,更能真实地反映学生的实际阅读水平:另一方面,人们在真实的阅读活动中,很少是按照文章体裁来阅读的,更多的是根据自身的兴趣、爱好或需要来阅读。文章的体裁本来就是人为划分的,近些年来,义务教育中逐渐提出了“淡化文体”的要求,目的就是要解放学生的思想,避免其在阅读、写作中被强烈的文体意识束缚住了思维。而这种按照阅读目的对阅读材料的划分则更符合人们真实的阅读生活,也更为合理。
  除了在宏观上对阅读材料进行了分类。用以指导阅读测试材料的选择之外,上述三大评价体系还都提出了选材的具体要求。例如,PISA特别强调了表格、图表、地图等类型的阅读材料应作为阅读测试材料的一部分。在我们国内以往的阅读测试中,这种类型的阅读材料往往是被忽视的,很少出现在试卷中。然而,在我们日常生活真实的阅读活动中,这些阅读材料又是很常见的,在读者的阅读活动中占有很大的比重,读者需要具备阅读这种类型文本的能力。PISA将它们作为阅读评价的一类材料提出来,是值得借鉴的。
  第三,三大国际阅读评价体系在制定主观性试题评分标准方面为我们保证主观题评分信度提供了良好的思路。在我国,长期以来,由于对标准化考试的追求,人们更多地关注采用客观题,例如选择题的形式来进行测试。但是阅读能力测试本身的特点决定了单纯使用客观性试题难以很好地反映出学生的阅读水平,一定量的主观性试题是必不可少的。主观性试题对于考查学生的思维过程和某些复杂的智力动作有其独特的优势和适用性,那么如何保证主观性试题的评分信度就成了首要问题。在我们国内的语文考试中,阅读部分本来就很简单的评分标准中不难见到类似“意思对即可”“酌情给分”的语句,这无疑是将给分大权完全交给了评分者个人,在评分标准含糊不清的情况下,评分者每人拿着自己的一把“尺子”去衡量学生的作答情况,结果可想而知。教育部初中毕业考试评价组在2006年语文中考命题指导中就强调:“有些(课程改革)实验区的开放性强的主观性试题,参考答案及评分标准不明晰、模糊性强,缺乏可操作性,评卷教师很难准确把握评价的尺度。例如,有的试卷只要求言之成理即可,有的试卷只给出示例。为了避免具体评卷过程中存在的模糊性和不确定性。应当注重制定科学性、弹性和可操作性相结合的参考答案和评分标准。”在合理制定阅读开放性试题评分标准、保证评分信度方面,三大国际上的阅读评价体系给了我们有益的启示。当然,我国也有我国的特殊国情。在我国,国家或者是省、市级的大规模教育考试一般都是高利害性的考试,比如高考、中考,一般不具备在正式考试前进行一定规模试测的客观环境。我们虽然不能完全仿效国外通过试测来修订评分标准的做法,但依然可以从他们的这种思路中获益。例如,我们可以在正式阅卷前抽取一定量的样本进行试评,将试评做细做精,根据试评中的学生答题样例来修订和充实评分标准,这也不失为一种好的方法。
  (二)深入反思语文教学的最终指归
  在我国的各级各类考试中,阅读测试一直是稳定而重要的考试内容之一。但国内现在的阅读测试多是停留在凭经验操作的层面上,往往不够清晰明确,缺乏系统化、理性化的思考与设计。上述国际三大阅读评价体系在明晰确定测试内容、理性选择测试材料、合理设计评分标准方面,确实有很多值得我们思考和借鉴的地方。虽然我国是个考试大国,自隋唐兴科举以来已有千余年的考试历史,但毋庸置疑,我们国内在测试方法和技术层面还须向国外学习借鉴。
  然而,抛开具体操作层面上的方法和技术,测试的内容确定、材料选择等呈现形态直接投射出了其所承载的理念——阅读教学,甚至是语文教学,它的最终指归在哪里?杜威在批评“传统教育”时曾经说过,传统教育“最大的浪费是由于儿童在学校中不能完全、自由地运用他在校外所获得的经验:同时,另一方面,他又不能把学校所学的东西应用

[1] [2] [4]