首页 -> 2006年第1期

NAEP阅读评价体系述评

作者:于 燕




  ●比较一下这本杂志中这篇文章和另一篇的结构。
  ●对______________来说这有什么作用?为什么?
  ●作者对______________(讽刺、象征、幽默)的运用恰当吗?解释一下。
  ●作者的观点是什么?运用文章中的信息,用一两句话来支持你的答案。
  ●这条信息对______________来说有用吗?解释一下。
  (二)评价的实施
  1.评价方法
  NAEP目的在于评价特定学生群体的阅读水平,他们采取全国随机分层抽样的方法确定参与测试的学生。用矩阵取样技术保证题目的量大、覆盖面广。从学生的回答中能收集几百条信息,但每个参与评价的学生完成的题目量是有限的,每个学生拿到手的只是整个评价内容的1/8或是稍多一点,每个学生完成题目所用的时间限制在大约50分钟。
  2.试题形式
  NAEP的阅读评价试卷,有的由两份答题时间为25分钟的材料组成,有的只有一份答题时间为50分钟的材料。给4年级学生的都是答题时间为25分钟的材料。试题以选择题或开放题的形式出现。开放题包括短的(通常答案包括一到两个句子)和长的(需用一段话或更长的篇幅进行较为深入的回答)两种。在题量上,开放题占到一半以上。
  3.评价选材
  为了创造一个接近于真实的阅读情境,更加真实地反映学生的阅读能力,NAEP的阅读文段一般都是学生在日常生活中能接触到的,像《故事会》等儿童杂志中的文章。选用测试材料遵循以下原则:所选文章要对学生的发展有益;所选文章在体裁、语言和组织等方面要符合相应的标准,这些标准主要包括对课程标准的考虑、题目的适切性、风格、视角和公平性。
  选用的文段一般都用原文,如果要修改,要保证不影响文章的难度水平或是作品的意义。测试材料的长短不同,4年级学生阅读250—800字的文章,8年级阅读400—1000字的文章,12年级阅读500—1500字的文章。
  4.命题范围
  NAEP的命题建立在阅读的四个方面和读者在理解时运用的相关策略的基础上。出题时,NAEP力图覆盖阅读的四个方面和文本本身的重要因素。参见附表1、2、3。
  
  
  
  
  5.审核过程
  命题过后,为了保证试题与评价框架有内在的一致性,NAEP请外界的阅读团体、测试专家审核评价的内容,一方面看其中是否存有偏见或敏感话题,另一方面从命题技术的角度加以审核。
  6.评分指导
  评分指导由ETS(教育测试服务机构)制定。长的开放题分四个层次评价,短的开放题有的分三个层次,而有的只有可接受与不可接受之分。每个开放题的评分指导都是独特的:出开放题的时候NAEP会随着给出初步的评分指导,学科领域和评价领域的专家检查此评分指导,以确保语言简洁、清楚、明白,能够反映评价框架的标准。此时的评分指导是出题人及相关领域的专家们认为合适的,并不能完全反映特定年龄段学生的真实水平。所以NAEP在正式测试之前会进行一次前测,用此评分指导对前测中学生的答案进行评分,根据前测中学生的答题情况进一步斟酌评分指导。同时ETS的评价专家们从前测中学生的答案里找出样例,进一步解释评分指导中的不同表现水平。在实际的评分过程中,样例帮助评分者相对一致地解读评分标准,从而保证评分时的准确、可信。
  
  二、NAEP阅读评价体系给我国语文阅读测试的启示
  
  新的语文课程改革实施以来,我国也开始对课改实验区学生的语文学业能力进行检测的工作。NAEP的阅读测试进行的时间长、效果好,有很多值得我们借鉴的地方,主要在以下几个方面:
  1.确立评价框架
  对于阅读能力的本质及其构成我国尚未形成统一的认识。对阅读的本质、阅读能力的构成进行探讨的学者很多,但这些探讨大多是基于阅读能力培养的探讨。基于阅读测试的探讨集中在高考的阅读测试中,以章熊先生的《中国当代写作与阅读测试》中对阅读能力的分析为代表。书中在综观国内外各家论述的基础上提出了阅读的能力可归纳为以下几项:认知能力;筛选能力;阐释能力;组合能力;鉴赏、评价、创造能力。目前我国的这种分析难以作为评价的有效框架。
  NAEP在分析当代多种理论的基础上,提出了阅读的三种情境、四个方面,形成了有效的评价框架。基于对情境的分析和对不同年级学生水平的把握,在NAEP的阅读测试中不同的年级需要面对的阅读情境是不同的,在相同的阅读情境下,分值比重是不一样的,见附表4。
  
  
  2.选材
  NAEP的选材力图为学生创造真实的阅读环境,从学生日常能够接触到的读物中选择阅读材料,这一点值得我们借鉴。NAEP关于不同年级学生阅读材料长度的确定是在分析美国学生情况的基础上做出的。汉语不同于英语,我国的教育水平与美国也不一样,学生日常的阅读量可能也不尽相同,所以我国的阅读测试在确定不同年级学生阅读材料长度的时候,需要结合我国特定的情况,加以调查、确定。
  3.评分标准的制定
  语文课程标准强调多元解读,那么评分标准较之以前也应有相应的变化。NAEP在评分时对不同的题目进行分层评分,并通过前测从学生的实际回答中举出恰当的例子,有助于评分者对评分标准的掌握,从而有助于减轻评分者效应。
  4.程序保证
  NAEP的阅读测试有一套相对完整的框架,在此基础上命题并给出评分标准、对评分标准进行检查、进行前测、调整评分标准、真正的测试及评分。这样一套程序从制度的层面上保证整个测试的信度和效度,这一点也非常值得我们借鉴。
  参考文献:
  (1)周红《美国国家教育进展评价(NAEP)体系的产生与发展》,《外国教育研究》,2005.2
  (2)《Reading Framework for the 2003 National Assessment of Education Progress》
  (3)章熊《中国当代写作与阅读测试》,四川教育出版社,2000
  
  
  附例题:为了获得文学体验的阅读
  
  饥饿的蜘蛛和一个乌龟
  
  蜘蛛是一个很容易饿的家伙,他总是想吃。每个住在Ashanti的人都知道他的这点爱好。他也很贪婪,总是想多吃一份,所以大家都离蜘蛛远远的。但是有一天,一个外人从这个国家的另一端来到了蜘蛛的住所,他的名字是乌龟。乌龟从家里出来已经走了很长的一段路。在大太阳下面走了一整天了,现在又累又饿。所以蜘蛛不得不把乌龟请到家里给他点什么吃的。蜘蛛不想这么做,可是如果他不对疲惫的旅行者表现得好客点,村子里的居民很快就会在背后议论他的。
  所以他对乌龟说:
  “这里有泉水,你可以洗一下手。沿着这条小路过去。我来准备一下晚餐。”
  乌龟背着他的壳尽可能快地向泉水爬去。他从泉里取点水,仔仔细细地把手洗了一下。然后沿着小路爬回来。但是这条小路很脏。等乌龟回到屋里的时候,他的手上又沾满了尘土。
  蜘蛛把食物都摆出来了,还都冒着热气儿,食物的味道让乌龟的口水都快流出来了。从早上日出后他就没吃过东西。蜘蛛很不满意地看着乌龟的手。
  “你的手实在是太脏了,”他说,“你不觉得你在开吃前该好好洗一下吗?”
  乌龟看着自己的手。他很不好意思,真的很脏。所以他又尽可能快地转身爬向泉水,他沾着泉水细细地又洗了一遍,然后又尽可能快地回去。但是乌龟走起来总是慢的,等他回到屋里的时候蜘蛛已经开吃了。

[1] [3]