首页 -> 2008年第4期

以数据导向改革社会经济统计学教学

作者:龚江辉




  摘要:目前高校的社会经济统计学教学过于偏重数理统计,忽略了培养学生分析社会经济现象的能力。本文从教学实践出发,提出以“数据导向”改革社会经济统计学教学的思路,培养学生认识数据和理解数据的能力。
  关键词:社会经济统计学;数据;教学
  
  社会经济统计学是高校经济管理专业的必修课之一,在经管类的专业课中属于教学难度较大的一门。不少学生反映统计学课程枯燥、难学、不实用,即使在考试中能够通过,在现实中也不知如何加以应用。改变这种状况的一个根本出发点,在于回归社会经济统计学课程的原始目的,以数据导向的原则对课程进行全面改革。
  
  一、目前社会经济统计学教学中存在的主要问题
  
  在过去,我国统计学界一直将社会经济统计学与数理统计学划分为两个性质不同的学派,将社会经济统计学完全限制于描述统计范畴,从而影响了社会经济统计学的应用。近年来,随着经济管理研究中数学模型的应用日益增加,统计学界又出现了一种矫枉过正的倾向,即过分偏向数理统计学,否认社会经济统计学的独立性。近年出版的各种统计学教材中,数理统计的内容所占比重不断增加,甚至到了满书都是数学公式的程度。
  目前的社会经济统计学课程由于过分偏向数理统计,在教学中仍以统计公式推导为主。许多统计学教师都是数学专业出身,对于严谨的数学逻辑框架情有独钟,但其面对的教学对象却属于带有明显文科性质的经管类专业学生,没有能力也没有兴趣去追求数学公式的完美。这就造成了教与学之间的矛盾。
  社会经济现象与自然科学现象有着本质的不同,一个重要的特点就是研究对象是人的活动,许多活动是很难用精确的数学逻辑来理解的。在自然科学研究中,通过严格控制实验过程,可以使数据表现出稳定的行为特征,与特定的研究模型相吻合。而在社会经济研究中,研究对象是不受约束的个人或者企业,其行为受到各种因素的影响,有时候会表现得十分异常。
  以回归分析为例,在数理统计学的教学中,学生拿到的教学习题数据都是性质良好的,回归结果往往表现出较强的统计显著性。但在真实的经济分析中,一次回归能够得到显著系数是非常难得的,由于现实中“噪声”的影响,大多数回归模型都无法通过统计检验。例如,从理论上说,居民的收入与支出之间应当存在着线性或者二次曲线型的相关关系,但学生在利用真实的统计数据进行分析时,往往很难得出这样的结论。一些数理统计成绩很好的学生在使用统计数据撰写论文时,经常会陷入一种困惑,即发现现实中的数据特征与自己所学的理论完全不能吻合。
  鉴于这样的问题,在社会经济统计学教学中,应当将更多的精力用于帮助学生形成认识和理解数据的能力,要教育学生适应各种“不完美”的数据,学会从数据中剔除“噪声”的影响,发现数据的本质。教学实践表明,这样的教学改革思路不但能够使课程更加适应现实需要,而且能够极大地调动学生的学习兴趣。
  
  二、数据导向的统计学教学思路
  
  数据导向在统计学教学中主要表现在以下三个方面:
  
  1.注重培养学生对于数据质量的认识
  数据质量是进行统计分析之前必须考虑的一个重要问题,由于各种人为因素的干扰,社会经济统计数据往往存在着不同程度的质量问题。在教学中,应当注重培养学生对调查数据质量的认识能力。
  调查是所有统计工作的起点,调查数据的质量直接影响到统计分析的效果。人们在日常所接触到的统计数据,都是通过各种渠道调查得来的,如果学生不了解调查的原理,就很难理解数据中各种错误的产生原因。在许多社会经济统计学教材中,统计调查所占的比重都很小,有些甚至直接与“抽样估计”的内容合并在一起,把抽样误差分析作为统计调查的惟一内容。事实上,统计调查所涉及的内容是非常广泛的,抽样误差只是其中很小的一个方面。把统计调查理解为仅仅是抽样误差计算,是一个极大的误区。
  基于这种考虑,应当大幅度提高统计调查内容在课程中所占的比重,使之达到全部课时数的1/3左右。教学内容应当包括统计调查的分类、各种抽样调查形式的优缺点、调查误差的来源等等,其核心在于使学生理解影响原始数据质量的各种因素。
  在有关抽样调查的内容中,如何确保抽样的随机性是一项重要的内容,对这项内容的深入讨论,能够帮助学生理解随机性对于统计工作的意义,以及在现实中各种可能出现的违背随机性要求的情况。
  调查中的非抽样误差是统计学研究的前沿,在传统的统计学教材中往往很少涉及,但这部分内容对于学生理解调查误差的来源有着重要的作用,因此在教学中也应当进行介绍。例如,目前许多媒体都喜欢引用网上调查的数据来分析社会经济现象,但从统计学角度来看,网上调查的抽样框是存在偏差的,其调查结果不能真实地反映全体居民的意见。要认识到这一点,就需要学生对于抽样框的概念、抽样框误差的形式等有一定的认识。对这部分内容进行讲授时,需要教师有一定的社会经济调查实践经验,能够结合现实情况来加以分析。这部分内容如果讲授得当,对于学生来说是很有趣味的。
  在条件允许的情况下,教师还可以组织学生参与统计调查的社会实践,通过亲手做几份调查问卷来加深对于统计数据质量的理解。
  
  2.以真实数据替代虚拟的教学数据
  传统的统计学教学,侧重于对方法的介绍。教学中使用的数据往往是虚拟数据,或者是经过精选和剪切后的真实数据,这类数据的惟一作用就是让学生练习在课堂中学习到的公式。学生只需要把数据代入公式,就能够得到一个近乎完美的计算结果。这种学习方式带来的一个负面影响是学生误以为统计就是一门利用公式进行计算的科学,而忽略了根据不同数据选择不同计算方法的要求。
  采用数据导向的教学方法,要求在教学中抛弃虚构的教学数据,而使用现实中的真实数据作为教学案例。教师对于选择的数据提交给学生,让学生根据所学的各种统计知识进行自主分析。教师应当向学生传递一种权变的统计观念,鼓励学生用不同的方法对同一批数据进行反复处理,从中选择最有效的处理方法。当学生拘泥于某一种习惯的分析方法时,教师应当提示他们思考为什么优先采用了这种方法,而没有采用另一种方法。比如,许多学生在进行综合评价时,习惯选择使用算术平均数,此时,教师可以组织他们讨论是否能够使用几何平均数或者中位数等其他的平均指标。
  在教学中,我们曾向学生提供了美国从1900年以来的所有统计年鉴的电子文件,要求学生从中选择出一些有价值的指标,分析美国的经济成长情况、劳动力变化情况等等。由于数据量非常庞大,学生可以选择出许多不同的角度来进行分析,包括横向的州与州的比较,纵向的年度间比较,不同指标间的相互比较等等。每一种分析方法都需要学生深入理解课堂中学习到的各种原理,通过这样的数据分析实践,学生既能够更好地理解统计的精髓,又能够产生浓厚的学习兴趣。
  
  3.借助实验方法解释统计概念
  数理统计学的教学侧重于公式的推导,而社会经济统计学则要求让学生更多地理解概念的含义。在教学实践中发现,经管专业学生对于统计分布、参数估计这样的概念往往很难理解,例如在讲授抽样估计的内容时,许多学生无法理解“样本平均数的标准差”这样一个概念,因为在他们的心目中,样本平均数是一次调查中获得的常量,对一个常量计算标准差是很难想象的。尽管教师可以完美地推导出样本平均数标准差的计算公式,但对于学生来说,这只是一个数学游戏,没有任何现实意义。
  统计本身是一门来自于实验的科学,数理统计最早起源于对赌场中各种胜率的计算。要帮助学生形成对推断统计概念的理解,就应当从实验出发,通过可触及的数据来理解概率、分布等抽象概念。
  以上述提到的抽样估计为例,在教学中,我们将学生分为若干个小组,每个小组发放一副扑克牌,要求他们按可放回的原则抽出30张牌,再计算出样本平均数。教师把各小组的平均数统一写在黑板上,学生就可以很直观地看出样本平均数事实上是一个随机变量,在不同的实验中表现出不同的值,因此可以计算期望值、标准差等统计量。
  利用计算机进行统计学教学实验具有简单易行和直观的优点,上述所提到的抽样估计实验,如果使用计算机来辅助,则会产生出更好的效果。这种采用计算机进行的统计实验需要教师具有一些初步的编程能力,包括借助于EXCEL的宏命令设计出一些简易抽样程序等。这方面的技术在此不予展开。
  
  [责任编辑:张冬梅]