首页 -> 2007年第2期
三种国际阅读评价体系给我们的启示
作者:付雪婷
类:学生“为了个人应用而阅读”,是为了保持或发展与他人的联系,或满足个人的兴趣需要而读书。阅读的材料一般包括个人信件、小说、传记以及为满足好奇心而阅读的信息性材料,这种阅读是作为休闲、娱乐活动的一部分。学生“为了公共应用而阅读”,是为了参与更大范围社会活动的需要。阅读的材料一般包括官方的文件和关于公共事务的信息等,如通知、布告、规章、计划方案等等。学生“为了教育而阅读”,通常是为了获取知识,是更大的学习任务的一部分。这里的阅读材料通常不是由阅读者自己选择的,而是由教师指定的,阅读的内容是为了教学的需要而具体设计的,包括课本、地图、纲要等,是“为了学习而阅读”。此外,据PISA调查,在大多数国家,十五岁的学生中很多在一到两年之内都会跨入劳动大军之列,所以测评他们的阅读能力是否能满足工作的需要是十分必要的。因此,PISA还提出了“为了工作而阅读”的情境。在这种情境下,阅读的材料一般包括说明书、手册、计划表、报告、备忘录、项目表等,是“为了做事而阅读”。
PIRLS认为,学生以不同的方式和文本互动来构建意义,他们构建意义的方式因阅读目的和文本类型的不同而不同,某种阅读目的对应某种类型文本。PIRLS区分出了两种不同的阅读目的:为文学体验或娱乐而阅读,为获取和使用信息而阅读。学生“为文学体验或娱乐而阅读”,主要目的是理解和欣赏文学性作品,阅读的材料属于文学型文本。学生“为获取和使用信息而阅读”,主要目的是了解周围的世界,阅读的材料属于信息型文本。
NAEP认为,学生在进行阅读时,不同的阅读情境会导致有差别的阅读活动。NAEP将这种阅读情境分为三类:为获取文学体验而阅读,为获取信息而阅读,为完成任务而阅读。后两者的区别就在于,“为完成任务而阅读”不只是获取和理解信息,还要运用信息。阅读的材料一般包括汽车或火车时刻表、课程表、说明书、地图等等。
从以上分析可以看出,PIRLS和NAEP对阅读材料的划分较为一致。PIRLS将阅读材料分为“为文学体验或娱乐而阅读”的文学型文本,和“为获取和使用信息而阅读”的信息型文本;NAEP将阅读材料分为“为获取文学体验而阅读”的文学型文本,“为获取信息而阅读”的信息型文本,以及“为完成任务而阅读”的信息型文本。PIRLS的“为获取和使用信息而阅读”实际上涵盖了NAEP的“为获取信息而阅读”和“为完成任务而阅读”,将“获取”和“使用”信息合为一种阅读目的。这样的做法更为合理。因为使用信息毕竟是以获取信息为前提的,不可能将获取信息的因素剔除出去而只谈使用信息;而且,在实际的阅读过程中,这两种阅读目的有时是很难清晰地区分开来的。所以说,NAEP的“为获取信息而阅读”和“为完成任务而阅读”二者之间有交叉。在实际的阅读测试中命题者难免会因此而出现认识上的分歧,容易给测试带来主观性和随意性:而PIRLS的做法则较为可取。PISA从另一个角度对阅读材料作了四类划分,虽然具体的类别和HRLS、NAEP的不尽一致,但划分出来的阅读材料却是大体相同的,可以打散后相应地划归人文学型文本和信息型文本两大类中。
三、评分标准的制定
无论是HSA、HRLS还是NAEP,其阅读测试中的开放题都给出了十分详细的评分标准。在命制阅读测试题目的时候,每道题的评分标准也就初步拟定好了。这时的评分标准一般是命题者基于对题目本身的认识和对学生作答该题的预期而制定的,因此此时的评分标准只是命题人员主观的“理想构架”,还不能直接运用到具体的评分过程中。这种“理想构架”需要根据学生在试测中的实际作答情况做出进一步的修整和完善。例如,在对能够代表所有被试的小样本群体做试测时,可能会出现这样的情况:所有学生的回答都没有达到命题者预期的最高水平的答案。这时就需要对评分标准的满分要求做出相应的调整——命题者预先设定的最高水平的答案是成人对文本解读的结果,而并不是特定年龄阶段的学生所能达到的,评分标准中的满分答案应该根据学生所能达到的最高水平做出修订。此外,还要对试测中学生丰富多彩的回答情况做出归类,确定哪些是可接受的,哪些是不可接受的,可接受的又可分为几种水平……这样,根据试测所反映出来的学生的具体答题情况对预设的评分标准进行修改、丰富、完善,把题目的每一种赋分情况都配以若干学生的回答样例,这样的评分标准就非常明确而具体,评分者在给分的时候就会有据可依,评分的主观性就大大降低了。
四、三种国际阅读评价体系给我们的启示
(一)理性构建阅读测试的框架体系
上述三大国际阅读评价体系都有非常系统、明确的评价框架设计,在测试内容的确定、测试材料的选择、评分标准的制定方面的有益经验值得我们借鉴。
首先,在阅读能力测试之前明确所要考查的内容,即主要的阅读能力要素,这样就使得命题的指向性很明确,避免了命题的盲目性与随意性;也便于根据命题意图和考查目标对学生的作答情况进行有针对性的分析,并提出相应的教和学的改进策略,这是我国的阅读能力测试首先值得借鉴的。在我国的语文考试中,阅读测试题目往往是依赖命题者的经验和个人对测试材料的理解和把握而命制的,对所要考查的目标阅读能力要素没有事先做出全盘性的把握和设计,例如,未预先对目标阅读能力要素进行清晰的认定,未设计各能力要素的考查权重和题目比例,等等。这样命制出的测试题目受命题者的主观经验和测试材料本身特点的影响很大。题目可能从表述上、形式上看来是不同的,但题目背后所考查的阅读能力要素却是雷同的,即所需学生完成的智力动作是相同的,或者也可能题目本身就偏离了考查的主旨,没有围绕着所要考查的核心阅读能力要素命制试题。这样的阅读能力测试就可能会造成有些能力要素重复考查,有些能力要素却被忽略或遗漏,考查结果很难代表学生的真实阅读水平。例如,2005年某课改实验区的语文中考试卷中,有这样一组阅读题目:
阅读下文,完成16-22题。(共21分,其中2分为附加分)
华语情结(文略)
16,结合具体语境,解释文中的加点词语。(三选一,多答不加分)(2分)
(1)风干、干缩 (2)跌跌撞撞 (3)嗫嚅
17,文中为什么说华语是一座高山?请用原文句子或自己的话来回答。(2分)
18,作者在文中叙述了华语从古至今的发展状况,请用恰当的词语(自己概括也可)完成下列表格。(2分)
19,文中流露出作者怎样的“华语情结”?(2分)
20,我们每天都在学习自己的母语,你喜欢上语文课吗?说出你的理由。(2分)
21,生活中处处有语文。举一个具体事例,说说你在课外学习语文的收获。(3分)
22,综合探究(6分,见解独到、语言精彩另加2