教学与管理（中学版）更多精彩：由此右转

首页 -> 2006年第6期

中考等级制与考试信度新探

作者：徐　敏　黄光扬

　　２００５年，教育部颁布《关于基础教育课程改革实验区初中毕业考试与普通高中招生制度改革的指导意见》，该指导意见明确指出：“学业考试的成绩应根据各学科课程标准的基本要求确定合格标准，提供普通高中录取用的学业成绩应以等级的形式呈现，等级数和等级标准应由各地根据考试结果，并结合当地优质高中资源的实际情况确定。”
　　采取等级制，是按照一种新的标准评价学生，为高中多样化录取创造了条件。本文试从教育测量与评价学的角度对等级制度进行一些新视角的理论探讨。［１］
　　
　　一、中考改革全面铺开，成绩等级制成趋势
　　
　　２００５年，中考改革实验区已从去年的１７个实验区拓展到５００多个，各地纷纷根据自身的具体情况加大中考和中招的改革力度。其中，中考学业成绩采用等级制成为本次改革的一大亮点。
　　等级制的划分存在两个侧重点，一种是根据学生成绩，通过测量结果转换法来确定不同的等级，称之为等距离区间划分，例如海南省的划分方案；另一种是根据当地优质高中资源的分布确定等级数及划分的标准，称之为资源划分，例如辽宁、江西等省的划分方案。下面简要介绍几个课程改革实验区２００５年中考采用等级制呈现考试成绩的具体方案：
　　海南省２００５年课程改革实验区的学业考试的成绩按百分制阅卷，等级制呈现。等级呈现特点是“等级＋星”，等级设置为：Ａ、Ｂ、Ｃ、Ｄ、Ｅ、Ｆ、Ｇ共７等，９０—１００分为Ａ等，８０—８９分为Ｂ等、７０—７９分为Ｃ等，６０—６９分为Ｄ等，５０—５９分为Ｅ等，１—４９分为Ｆ等，０分为Ｇ等。每科考试按１２０％分超量给题，对每科超过１００分的给予星级记录，１０１—１０５分加一颗星、５分一档，以此类推，每科最多加四颗星。
　　江西省２００５年基础教育课改实验区各科试卷仍旧是以分数命制，但考试成绩将以全新的等级制方式呈现，即设Ａ、Ｂ、Ｃ、Ｄ、Ｅ五个等级。各地根据当地高中教育资源的情况和报考人数来划定每个等级所占的比例，然后再将卷面分数转换为相应等级，卷面分数则不再与考生“见面”。
　　辽宁省沈阳市规定，２００５年中招学业考试的成绩主要是以Ａ、Ｂ、Ｃ、Ｄ、Ｅ五级方式表现，分别代表优、良、中、及格、不及格，各等级比例由各市确定，但Ｅ级比例应当控制在５％以内。^［１］
　　上海市２００５年中招《思想政治》（开卷）时间为７０分钟，卷面总分为１００分，考试成绩呈现分优秀、良好、及格、不及格四个等级。分数不计入总分，但不及格者将不能被市实验性示范性高中和区县重点中学录取。
　　随着基础教育课程改革的不断深化，将有越来越多的省、直辖市、自治区采取“等级制”的中考评价方式。中考学业成绩采用等级制的评价方式逐渐成为趋势。
　　
　　二、成绩等级制的概念及其应用情况分析
　　
　　等级制是以等级方式呈现学生的学业成绩与表现，具体可以分为绝对评价等级制和相对评价等级制。前者按照既定的学业标准把学生的学业成绩与表现划定为若干等级，包括教师综合评价法、测量结果转换法、核心内容参照法。而后者则是按照一定的方案来划定每个等级所占的比例，从而体现每个学生的卷面成绩在同类考生团体中所处的相对位置。根据比例划分方案或等级数的不同，可将相对评价等级制分为五分等级制、十分等级制等。^［２］
　　以海南省２００５年所用等级制划分为例，他们采用的方法是“测量结果转换法”，属于绝对评价等级制。这种方法通常是在举行正式测验或考试之后，把测量得到的分数按照事先规定的分数段标准转换成等级分数，而具体的等级数，可依据实际情况确定，最常见的是五级记分制，其划分规定如下表：
　　

　　有些则采用七级记分制，７分为最优，４分为及格，３分以下不及格。另外还有十级记分制，通常在百分制的每１０分为一个分数段下面进行转换，即９０—１００分对应十级记分制下的１０分，８０—８９分对应十级记分制下的９分，依次类推，１０分最高表示优异（特优）、９分为优秀、８分为良好、７分为中等、６分为及格、５分及以下为不及格。^［３］当然，根据需要也有其它的转换法，如上所提及的海南省所采用的“等级＋星”的方式。
　　而江西省与辽宁省采用的五分等级制，虽然与绝对评价等级制中五级记分制的等级数相同，但它却属于相对评价。其具体的评定方法是把学生的成绩（通过考试或教师综合评估后得到的成绩）从高分到低分排列，然后根据考生总数按照一定比例赋予考生相应的等级。这个比例可以视实际情况而定。其中，江西省是根据各市高中教育资源的情况和报考人数来划定。而辽宁省除此之外还规定，Ｅ级（不及格）的比例应控制在５％以内。
　　
　　三、从信度角度重新认识等级划分的科学性
　　
　　采用等级制度，避开了“分分计较”的百分制，淡化了考试分数在同一分数段中的细小差异，而这时争议就转到等级划分的科学性上来。２００５年的中考，海南省采用“等级＋星”的分数制度，其分数段的划分是否合理？“５０到１００分，每１０分为一个档，”这样的划分，合理性如何？为何“超过１００分，每５分为一档”？江西省和辽宁省采用的五分等级制，其比例分配是否科学？笔者拟从考试信度这个角度，对等级制度的科学性进行新的探讨。
　　
　　１．考试信度的含义
　　考试信度，简单地说是考试结果的可信程度，是推测考试可信与否最重要的量化指标。由于任何考试结果都因考试误差的客观存在而受到或多或少的影响，这种误差到底有多大，可用考试信度来刻划。
　　考试信度越高，说明考试分数的误差越小，考试成绩越能代表学生个人的真实水平。
　　譬如，信度为０．８的考试就意味着，学生群体的成绩波动（方差）有８０％由真实水平的差异性（方差）引起，另外２０％则由各种误差引起。一般认为标准化考试的信度系数应该在０．９０以上，例如，托福考试的考试信度在０．９５以上，ＨＳＫ（中国汉语水平考试）考试的考试信度一般在０．９８左右。
　　
　　２．等级划分中的考试信度研究
　　由于考试的信度总小于１，即其可靠性不能达到１００％，也就是说，考试分数误差是客观存在的，任何一个学生的卷面分数Ｘ都包含真分数Ｔ和误差分数Ｅ。^［４］因此，在中招过程中，以一两分之差论高低，是不科学的。这正是人们反对百分制“分分计较”的主要原因，同样，由于这些误差的存在，使考试信度成为分数段划分科学与否的理论依据。
　　在教育测量与评价中，学生的真实水平若用Ｔ来表示，Ｘ为学生的卷面成绩，ＳＥ为考试标准误，则学生的真实水平Ｔ很可能落在区间［Ｘ－ＳＥ，Ｘ＋ＳＥ］上。因此，当分数段划分的区间选取２ＳＥ时，该生的真实水平就能得到合理的体现。
　　

　　其中Ｓｘ是考试标准差，Ｒｘ为考试信度，可以发现考试标准误ＳＥ与信度之间存在着密切的关系。依照不同信度，不同的考试标准差，可得到以下考试标准误ＳＥ表格：
　　

　　从上表可以看出，当标准差Ｓｘ相同时，信度Ｒｘ越高，则考试的标准误ＳＥ就越小，那么分数段划分的区间２ＳＥ也就相应较小，反之亦然。
　　据统计，中考的标准差一般在１０到１５之间，因此，当考试信度Ｒｘ为０．９时，可根据实际情况，选取５分为一个分数段较为合宜。若盲目地以１０分为一档，将８１分与９０分归入同一个等级，则在一定程度上打击了高分者的积极性。反之，若考试信度Ｒｘ为０．７５，则选取８分以上为一个分数段较为合宜。
　　综上所述，等级划分的过程中要以考试信度为理论依据，当考试信度高时，等级划分就要细致，分数段的取值要小。如此，才有利于修正考试误差带来的不公平性。在将分数制转化成等级制的过程中，考试信度应当作为重要的理论依据予以高度重视。只有增强对各个细节上的科学化认识，中考制度才能得到不断的完善。
　　参考文献
　　［１］刘决生．聚焦中考等级制招生．中国教育报，２００５－０９－２１．
　　［２］黄光扬．成绩评定等级制的类型及其在国内外义务教育阶段中的应用．教学与管理，１９９８（３）．
　　［３］黄光扬．教育统计与测量评价综合教程．福州：福建科学技术出版社，２００３．
　　［４］沈小碚．考试评分体系的确立及其科学化认识．湖北招生考试，２００２（６）．
　　（责任编辑孙晓雯）
　　

整理者：绝情谷 2009年3月 TOP

首页 -> 2006年第6期

中考等级制与考试信度新探

作者：徐 敏 黄光扬

作者：徐　敏　黄光扬