首页 -> 2006年第6期

中考等级制与考试信度新探

作者:徐 敏 黄光扬




  2005年,教育部颁布《关于基础教育课程改革实验区初中毕业考试与普通高中招生制度改革的指导意见》,该指导意见明确指出:“学业考试的成绩应根据各学科课程标准的基本要求确定合格标准,提供普通高中录取用的学业成绩应以等级的形式呈现,等级数和等级标准应由各地根据考试结果,并结合当地优质高中资源的实际情况确定。”
  采取等级制,是按照一种新的标准评价学生,为高中多样化录取创造了条件。本文试从教育测量与评价学的角度对等级制度进行一些新视角的理论探讨。[1]
  
  一、中考改革全面铺开,成绩等级制成趋势
  
  2005年,中考改革实验区已从去年的17个实验区拓展到500多个,各地纷纷根据自身的具体情况加大中考和中招的改革力度。其中,中考学业成绩采用等级制成为本次改革的一大亮点。
  等级制的划分存在两个侧重点,一种是根据学生成绩,通过测量结果转换法来确定不同的等级,称之为等距离区间划分,例如海南省的划分方案;另一种是根据当地优质高中资源的分布确定等级数及划分的标准,称之为资源划分,例如辽宁、江西等省的划分方案。下面简要介绍几个课程改革实验区2005年中考采用等级制呈现考试成绩的具体方案:
  海南省2005年课程改革实验区的学业考试的成绩按百分制阅卷,等级制呈现。等级呈现特点是“等级+星”,等级设置为:A、B、C、D、E、F、G共7等,90—100分为A等,80—89分为B等、70—79分为C等,60—69分为D等,50—59分为E等,1—49分为F等,0分为G等。每科考试按120%分超量给题,对每科超过100分的给予星级记录,101—105分加一颗星、5分一档,以此类推,每科最多加四颗星。
  江西省2005年基础教育课改实验区各科试卷仍旧是以分数命制,但考试成绩将以全新的等级制方式呈现,即设A、B、C、D、E五个等级。各地根据当地高中教育资源的情况和报考人数来划定每个等级所占的比例,然后再将卷面分数转换为相应等级,卷面分数则不再与考生“见面”。
  辽宁省沈阳市规定,2005年中招学业考试的成绩主要是以A、B、C、D、E五级方式表现,分别代表优、良、中、及格、不及格,各等级比例由各市确定,但E级比例应当控制在5%以内。[1]
  上海市2005年中招《思想政治》(开卷)时间为70分钟,卷面总分为100分,考试成绩呈现分优秀、良好、及格、不及格四个等级。分数不计入总分,但不及格者将不能被市实验性示范性高中和区县重点中学录取。
  随着基础教育课程改革的不断深化,将有越来越多的省、直辖市、自治区采取“等级制”的中考评价方式。中考学业成绩采用等级制的评价方式逐渐成为趋势。
  
  二、成绩等级制的概念及其应用情况分析
  
  等级制是以等级方式呈现学生的学业成绩与表现,具体可以分为绝对评价等级制和相对评价等级制。前者按照既定的学业标准把学生的学业成绩与表现划定为若干等级,包括教师综合评价法、测量结果转换法、核心内容参照法。而后者则是按照一定的方案来划定每个等级所占的比例,从而体现每个学生的卷面成绩在同类考生团体中所处的相对位置。根据比例划分方案或等级数的不同,可将相对评价等级制分为五分等级制、十分等级制等。[2]
  以海南省2005年所用等级制划分为例,他们采用的方法是“测量结果转换法”,属于绝对评价等级制。这种方法通常是在举行正式测验或考试之后,把测量得到的分数按照事先规定的分数段标准转换成等级分数,而具体的等级数,可依据实际情况确定,最常见的是五级记分制,其划分规定如下表:
  
  有些则采用七级记分制,7分为最优,4分为及格,3分以下不及格。另外还有十级记分制,通常在百分制的每10分为一个分数段下面进行转换,即90—100分对应十级记分制下的10分,80—89分对应十级记分制下的9分,依次类推,10分最高表示优异(特优)、9分为优秀、8分为良好、7分为中等、6分为及格、5分及以下为不及格。[3]当然,根据需要也有其它的转换法,如上所提及的海南省所采用的“等级+星”的方式。
  而江西省与辽宁省采用的五分等级制,虽然与绝对评价等级制中五级记分制的等级数相同,但它却属于相对评价。其具体的评定方法是把学生的成绩(通过考试或教师综合评估后得到的成绩)从高分到低分排列,然后根据考生总数按照一定比例赋予考生相应的等级。这个比例可以视实际情况而定。其中,江西省是根据各市高中教育资源的情况和报考人数来划定。而辽宁省除此之外还规定,E级(不及格)的比例应控制在5%以内。
  
  三、从信度角度重新认识等级划分的科学性
  
  采用等级制度,避开了“分分计较”的百分制,淡化了考试分数在同一分数段中的细小差异,而这时争议就转到等级划分的科学性上来。2005年的中考,海南省采用“等级+星”的分数制度,其分数段的划分是否合理?“50到100分,每10分为一个档,”这样的划分,合理性如何?为何“超过100分,每5分为一档”?江西省和辽宁省采用的五分等级制,其比例分配是否科学?笔者拟从考试信度这个角度,对等级制度的科学性进行新的探讨。
  
  1.考试信度的含义
  考试信度,简单地说是考试结果的可信程度,是推测考试可信与否最重要的量化指标。由于任何考试结果都因考试误差的客观存在而受到或多或少的影响,这种误差到底有多大,可用考试信度来刻划。
  考试信度越高,说明考试分数的误差越小,考试成绩越能代表学生个人的真实水平。
  譬如,信度为0.8的考试就意味着,学生群体的成绩波动(方差)有80%由真实水平的差异性(方差)引起,另外20%则由各种误差引起。一般认为标准化考试的信度系数应该在0.90以上,例如,托福考试的考试信度在0.95以上,HSK(中国汉语水平考试)考试的考试信度一般在0.98左右。
  
  2.等级划分中的考试信度研究
  由于考试的信度总小于1,即其可靠性不能达到100%,也就是说,考试分数误差是客观存在的,任何一个学生的卷面分数X都包含真分数T和误差分数E。[4]因此,在中招过程中,以一两分之差论高低,是不科学的。这正是人们反对百分制“分分计较”的主要原因,同样,由于这些误差的存在,使考试信度成为分数段划分科学与否的理论依据。
  在教育测量与评价中,学生的真实水平若用T来表示,X为学生的卷面成绩,SE为考试标准误,则学生的真实水平T很可能落在区间[X-SE,X+SE]上。因此,当分数段划分的区间选取2SE时,该生的真实水平就能得到合理的体现。
  
  其中Sx是考试标准差,Rx为考试信度,可以发现考试标准误SE与信度之间存在着密切的关系。依照不同信度,不同的考试标准差,可得到以下考试标准误SE表格:
  
  从上表可以看出,当标准差Sx相同时,信度Rx越高,则考试的标准误SE就越小,那么分数段划分的区间2SE也就相应较小,反之亦然。
  据统计,中考的标准差一般在10到15之间,因此,当考试信度Rx为0.9时,可根据实际情况,选取5分为一个分数段较为合宜。若盲目地以10分为一档,将81分与90分归入同一个等级,则在一定程度上打击了高分者的积极性。反之,若考试信度Rx为0.75,则选取8分以上为一个分数段较为合宜。
  综上所述,等级划分的过程中要以考试信度为理论依据,当考试信度高时,等级划分就要细致,分数段的取值要小。如此,才有利于修正考试误差带来的不公平性。在将分数制转化成等级制的过程中,考试信度应当作为重要的理论依据予以高度重视。只有增强对各个细节上的科学化认识,中考制度才能得到不断的完善。
  参考文献
  [1] 刘决生.聚焦中考等级制招生.中国教育报,2005-09-21.
  [2] 黄光扬.成绩评定等级制的类型及其在国内外义务教育阶段中的应用.教学与管理,1998(3).
  [3] 黄光扬.教育统计与测量评价综合教程.福州:福建科学技术出版社,2003.
  [4] 沈小碚.考试评分体系的确立及其科学化认识.湖北招生考试,2002(6).
  (责任编辑孙晓雯)