首页 -> 2006年第6期

英语测试的正反拨效应个案研究

作者:余红晖 黄若妤 李少雄




  一、引言
  
  近年,许多高校在大学英语教学中实施分级教学,相关论文多论及分级教学的必要性、理论依据、利与弊等,但缺少从测试的视角出发,研究测试在分级教学中的作用。本文拟阐述测试的反拨效应,语言测试的重要质量指数:信度、效度、难易度和区分度等基本概念,以我校02级分级教学过程中三次测试为例,分析如何综合考虑试题的信度、效度,把握试题的难易度和区分度,发挥测试对分级—滚动教学的重要指导作用。
  
  二、分级测试试题设计的理论依据
  
  1.语言测试的反拨效应
  教育界把测试对教学和学习的影响称为反拨效应(back wash or wash back)。英国应用语言学家把这一概念引用到应用语言学领域,特指语言测试,尤其是外语测试对相关教学及学习者产生的影响。率先对语言测试的反拨效应进行比较全面和深入探讨的是Alderson & Wall(1993),他们提出15个反拨效应假设(Washback Hypothesis),指出测试可能对教师和学生的教与学的内容、方法、速度和顺序、程度和深度以及学习动机和态度等方面产生正反拨效应或负反拨效应,因而应予以足够的重视和关注。
  
  2.信度(reliability)、效度(validity)
  信度和效度是衡量测试质量的两个基本指标。信度指考试结果的可靠性、客观性和稳定性,通常以两次测试结果的相关系数——信度系数(coefficient of reliability)来表示,相关程度越高,信度越高。效度指测试内容是否与测试设计者预定目的和考查内容相符,即在多大程度上考了想要考的。因而,如何兼顾测试的高信度、高效度是保证测试高质量的关键。
  
  3.难易度指数、区分度指数
  题目的难易度指答对题目的比率,美国教育考试服务中心建议采用△来表示难度指标:△=13+4Z,Z=标准分=X-X/S(X为某一个原始分数值,X为平均数,S为标准差),△值在1~25之间,值越大,题目越难,理想值为13。
  区分度指一个题目区分考生能力的程度,可用点双列相关系数法(point bi-serial correlation coefficient)表示,即求出考生的总分和题目答对率的相关性。计算公式为:
   数;Xp=选择正确答案的考生的总分的平均数;Xq=选择其他非正确答案的考生的总分的平均数;SX=所有考生总分的标准差;p=选择正确答案的考生与全体考生的比例;q=选择错误答案的考生与全体考生的比例。按此公式算得的值在-1~1之间,当点双列相关系数为0.25或高于0.25时,表明此题目可以接受,指数越大,试题区分能力越强,反之,区分能力越弱。
  
  三、三次测试试卷分析
  
  我校英语教学实行分级-滚动管理模式:新生入学立即参加分级考试,通过者被编入Ⅱ级班直接学习大学英语(Ⅱ),未通过者被划入Ⅰ级班学习大学英语(Ⅰ);第一学期末,Ⅱ级班学生及I级班的优秀生参加第二次分级考试,第二学期,通过者学习第三册,未通过者和其他I级班学生学习第二册;第二学期期末,按同样的方式和原则进行第三分升级考试,第三学期,通过者学习第四册,期末参加全国大学英语四级统考,第三学期末,通过者与其他Ⅰ级班学生学习第三册;第四学期,Ⅰ级班学生和未通过四级的Ⅱ级班学生学习第四册,期末参加四级统考。
  在大学英语分级—滚动教学管理模式下,测试先于教学行为,测试结果直接影响教师与学生教与学的内容、方法、速度和顺序、程度和深度。因而,设计者必须准确把握试题的信度、效度,难易度和区分度,让不同水平的英语学习者在适合自己程度的环境下学习。基于不同的语言观,当今外语教学界使用的测试方法主要有三种:心理测量学测试(Lado,1961)、心理语言学—社会语言学综合性测试(Carroll,1980)和交际语言测试(Bachman,1991)。但没有哪种测试方法能把效度和信度完美地结合起来。因此,外语教学界大都综合利用三种测试模式,以心理测量测试为主,辅之以心理语言测试和交际语言测试,全国大学英语四、六级统考采用的就是这种测试方式。我校分级测试也是以这种理论为指导设计出来的。现以02级三次分级测试试卷为例研究测试对教学的反拨效应。
  
  1.入学分级测试
  入学分级测试的目的是区分考生的英语水平,实施因材施教,属于水平测试。现根据本文第二部分的理论和公式,求得本次测试相关质量指标,见表1:
  
  从表1、表2可知,这次考试的客观题信度指数较高,主观题信度稍低,但仍在可接受范围之内,这说明本次测试的可靠性较高;及格率偏低,达到选拔优生的目的;标准差偏高、难度指数为13.31接近理想值13;根据点双列相关系数法求得每道题目的区分度指数发现:72.5%的题目区分度在0.25以上,在可接受范围内。以上数据表明本次测试能较好地把握测试的信度、难易度和区分度。另外,可以对通过者和未通过者的高考分数和分级考试分数进行比较,观察本次测试是否具有共时效度。见表2:
  
  从表2可知,通过入学分级测试的II级班学生中,半数以上高考成绩优良,只有6位同学高考不及格却通过了该测试,而I级班未通过该测试的学生中九成以上高考成绩一般或不及格,这表明该测试能较好地把握试题的各个质量指标,与高考具有共时效度,为02级分级-滚动教学管理模式的顺利开展奠定了重要的基础。
  
  2.第二、三次分级测试
  第二、三次分级测试目的是检测Ⅱ级班学生通过一个学期的学习是否达到相应册级水平,把Ⅰ级班中英语成绩优秀者选拔到Ⅱ级班跨级学习,是阶段性成绩测试和语言水平测试的结合。因此,试题的设计与入学分级测试试题相比更为注重试题的内容效度和结构效度,课内课外内容比例和主观客观题比例。测试结果数据统计见表3:
  
  第二次分级测试的结果:39位I级班优秀生有9名通过,升入Ⅱ级班,Ⅱ级班有10名未通过,回到Ⅰ级班;第三次分级测试的结果:6名升级,7名降级。两个班人数基本不变,两次测试有效指导滚动管理模式的实施,确保了改革的顺利进行。
  
  3.三次测试对分级-滚动教学的正反拨效应
  我校02级两年分级-滚动教学的成果:(1)Ⅱ级班学生的四级考试通过率为86.4%,远远超过Ⅰ级班的通过率45.7%,这表明三次测试具有较高的信度、效度、区分度和预测能力。(2)Ⅰ级班学生经过四个学期的学习,虽然其四级通过率明显低于Ⅱ级班,但仍然超过往届(未分级)的整体过级率(最高为39.1%),这说明分级测试和分级教学促进了大面积普通学生的英语学习。(3)02级Ⅰ、Ⅱ级班平均通过率为56.7%,远超往届,亦高于同期全国重点和非重点院校的平均通过率(分别是45.7%和24.5%);同时70分以上为24.4%、80分以上为6.1%,而全国重点分别为24.2%、8.4%;全国非重点分别为9.6%、2.5%。这表明高质量的分级测试对我校的大学英语整体教学水平产生良好的、多方位的正反拨效应。
  
  四、结语
  
  英语测试是英语教学中一个不可缺少的环节,它既是对英语教师教学效果的检测,更是了解学生学习情况,把握学生的水平高低,实施因材施教的重要手段。在分级-滚动教学管理模式下,分级测试对教师与学生在教学方法、手段、进度、内容和方法、速度和顺序、程度和深度以及学习动机和态度方面起着重大的反拨效应。因此,如何在现代语言测试理论的指导下,设计出高质量的分级测试试题是分级-滚动教学成功的关键。
  (参考文献本刊略)
  (责任编辑李海燕)