首页 -> 2007年第1期

大学英语大规模口语测试的探讨研究

作者:周忠新




  为了解决面对面考试带来的一系列问题,燕山大学采用了大规模的数字化口语考试,其优势如下:
  1)采用数字化语音室进行口语考试,可以提高考试效率,减少考试时间。让学生预先知道自己的考试场次、考试时间、考试地点,这样最大限度的将考生的候考时间缩短。由于大量考生可以同时同地参加考试,大大提高了考试效率;
  2)采用数字化语音室进行口语考试,参加考试的全部考生听到的发问声音是一样的,公平性增高,考试信度提高;
  3)减少紧张感,减轻心理压力。由于采用语音室考试,考生不用直接与发问官接触,无形中减轻了考生面对陌生发问官和口语考试的双重紧张感,使学生发挥正常;
  4)使用语音室进行口语考试,对外语老师的需求降低。只是需要前期专业外语教师录制考题,如果需要现场发问,也就是一个考场一位外语教师,将外语教师口语考试的负担减轻到最低,将口语考试的复杂度降至最低;
  5)数字语言实验室由于采用先进的网络技术,听说的质量能够得到保证;
  6)口语考试的录音文件采用wav格式,考试结束后老师可以将考试的声音文件刻成光盘,或者用硬盘考走,这样评分可由专业人员统一在方便的时间和舒适的地方进行。这样老师在批阅学生声音文件的时候可以很轻松、很清楚的听到学生发音的每一个细节,而且在不能作出准确判断时可以反复地听,使评分更加公正可靠[6],从而使考试信度提高,表1是对120名考生进行口语考试使用传统方法和数字语音室方法的对比:
  
  由此可见,数字化口语测试可以节省大量的人、财、物力,信度可以得到保障,在燕山大学大规模推广完全是可行的。
  
  4燕山大学大规模口语测试的成功尝试
  
  2006年5月12日,燕山大学2004级建工学院七个班的195名学生进行了第一次大规模口语考试试点,取得了成功。6月23日,又将口语考试范围扩大,来自机械、电气、信息、材料、建工等学院32个班的920名学生顺利进行了口语考试。考生样本:参加此次口语考试的学生都是大学英语教学改革试点班及对比班的学生,来自5个学院的32个自然班,目的是获取口语考试的对比数据。
  
  4.1调查问卷
  考试前两周,笔者设计了一份有关口语考试的调查问卷,问题及答案如表2所示。
  从以上问卷得知,绝大多数学生从未参加过口语考试,他们认为学习英语口语重要和非常重要,但是考试不考口语,学校又缺乏口语环境,他们练习口语缺少动力。并且大部分同学表示,如果参加口语考试的话,他们不想和考官直接对话,而是选择与同学对话,或者在语言实验室中实行机考。问卷还显示,同学们认为增加口语测试将非常有助于同学们提高学习口语的动力。目前我们正准备在学期考试中增设口语考试,以便最终与大学英语四、六级口语测试相衔接,以考促学,以考促教。因此,大规模推广口语测试以反拨大学英语教学已经是迫在眉睫。
  
  4.2 考试设计
  本次口语考试是对2004级学生在大二英语课程结束后进行的口语能力评估,考试内容和难度根据新的《大学英语课程教学要求》对口语能力的整体要求设计,即“能在学习过程中用英语交流,并能就某一主题进行讨论,能就日常话题和英语国家的人士进行交谈,能就所熟悉的话题经准备后作简短发言,表达比较清楚,语音语调基本正确;能在交谈中使用基本的会话策略。”
   此次口语考试包括3个部分:
  1)热身问题,考生回答自己的姓名、班级、学号、专业、座位号等个人信息,以及兴趣、爱好等内容,目的是消除紧张感,为下一步的考试做好准备。热身问题是口语测试中最真实的语言交际活动,它是个人信息的口语表达,交际情景和语境真实,能体现Bachman 提出的交际语言能力的3个方面,即语言知识,策略能力和心理生理机制[7]。此题让考生准备半分钟,讲话3分钟;
  2)就某一学生熟悉的话题发表自己的看法,类似于个人演讲,本题型是现实生活中常见的一种交际形式,能充分展示考生逻辑组织能力和语言交际能力,反映考生的语言水平。让考生准备1分钟,发言4分钟;
  3)给出几个单词或短语,让学生根据词语提示口头作文,考查学生的逻辑思维和想象能力,它不受听力和阅读能力的影响,使测试集中口语表达,考生有很大的发挥余地。本题让考生准备1.5分钟,口头表达4分钟。
  考场中的60名考生对着麦克风,按耳机中的提示同时进行回答、议论和口头作文,学生无需任何操作,计算机自动将学生考试录音存入硬盘。
  
  4.3考试评分
  按照Heaton的说法:“口语是一个极难测试的技能,因为它是一个非常复杂的机能,以致不能设计出任何可信的分析方法供我们客观地测量它。”[8]尽管如此,考前我们还是制定了统一的评分标准,采用题型分项评分法,即对这3个题分别打分,主要根据考生对各题内容的表达的准确程度、流利程度和连贯程度以及对语音、语调、语法的正确性和词汇丰富程度等分别打分,满分为10分。即热身问题(0~3分)就某一话题的论述(0~3分)根据提示词口头作文(0~4分)。
  在题型分项评分的基础上,又对语言能力的单项分进一步细化。具体地说就是,就某一道题而言,语音、语调、语法正确,可以得到该题40%的分数;表达准确、流利、适切、可以理解,则可以得到该题60%的分数。
  为进一步统一评分标准,减少阅卷老师的主观随意性,增加口语考试的信度,在以上评分基础上对阅卷老师进行了培训,并且由十名老师共同听五位同学的考试录音,然后按照评分标准打分,并且让每位老师说出所给分数的原因。接下来,再对十位老师所给分数进行综合、平均,最后将平均分作为该考生的口语得分,并将这一分数作为全体阅卷老师的参考标准之一。
  
  4.4考试结果与传统考试比较
  考试结束后,随机抽取了16名考生,并用传统的面对面考试形式对他们再次进行了口语测试,并将两种考试结果作了比较,见表3。
  
   本次口语考试总分为10分,平均分为6.4,这说明学生的整体口语水平不高,但已经有了一些基础。标准差为1.55,比较小,表明大部分同学的口语能力比较接近。平均分、中位数和众数都比较接近,说明此次所采集的样本趋于正态分布,有一定的代表性。同时也应注意到,全距为6.5比较大,表明有的学生口语水平已经非常高,而有的同学口语还相当差。
  这次与考官面对的直接口语测试总分同样为10分,平均分为6.28分,略低于机考成绩,可能是由于个别考生面对考官心理紧张,未能充分发挥自己的水平。中位数和众数相同,都接近平均分,标准差很小,仅为1.38,说明同学们的口语成绩非常接近,且呈正态分布;但全距为6,还是比较大,表明口语好的同学和差的同学差距很大。
  
  4.5考试结果分析
  从这次抽样数据结果可以看出,考生通过数字化语音室考试所得到的成绩与直接面试取得的成绩基本相同,最多相差不过半分,并且有的考生面对考官可以更充分的发挥自己的口语水平和交际能力;而有的考生面对考官时会感到紧张,不能发挥自己的真实水平。但总的而言,数字化考试具有很高的效度和信度,不失为一种大规模推广口语测试的首选考虑。
  通过组织、实施两次近千人的口语测试,我们也积累了丰富经验,为下一阶段在全校全面铺开奠定了基础。
  
  5大规模口语测试中需要注意的问题
  
  保证计算机运行平稳:提前检查调试好计算机,并确保耳机、话筒等能够正常使用;录制好试题和备用试题,为各种突发事件做好准备,做到有备无患,保证考试的顺利进行。
  由于口语考试在语音室里进行,考生对着话筒讲话,学生的口语水平能够得到测试,但交际性能力考核可能会受到影响, 所以要设计出更加适合测试交际能力的试题。
  为提高信度,阅卷前对评分老师进行培训,统一评分标准,首先由几名老师共同打分,取平均分,作为每位老师的参考分。
  提前告诉学生有关注意事项,可提高考试效率,消除紧张感,避免误操作,让学生充分发挥出自己的水平。
  
  6结束语
  
  在口语考试越来越受到人们关注,但传统的面对面口语考试很难在全国大规模实行的背景下,数字化语音室进行的口语考试应运而生。由于可以同时对大量学生进行口语测试,从而节省大量的人力、物力、财力和时间,并且考生水平的发挥不受考官本身语言和情绪的影响,考试信度和效度较高,评卷老师可以在方便和舒适的地点阅卷,这一口语测试手段是适合我国高校实际的一种口语测试方法。虽然它还有需要进一步完善的地方,但总的说来,大学英语大规模口语考试采用数字化方式进行已经是大势所趋。
  
  参考文献
  1教育部高等教育司.大学英语课程教学要求[M].北京:清华大学出版社,2004.
  2伍新春.高等教育心理学[M]. 北京:高等教育出版社,1999.
  3金艳.大学英语四、六级考试口语考试对教学的反拨作用[J].外语界,2000,(4).
  4杨惠中.大学英语口语考试设计原则[J].外语界,1999,(3).
  5文渤燕.大学英语口语测试探讨[J]. 外语界,2000,(3).
  6 金艳,郭杰克.大学英语四、六级考试非面试型口语考试效度研究[J].外语界,2002,(5).
  7 Bachman L F.Fundamental Consideration in Language Testing[M].上海:上海外语教育出版社,1990.
  8Heaton J B.Writing English Language Tests[M].New York:Longman Group UK Limited,1998.
  

[1]