湘潭大学研究人员:工具变量因果测评方法在工程教育领域的应用

  在计量研究方法不断更迭的当下,因果推断方法在社会科学研究方面取得了长足发展,因果关系推断方法和教育评估方案的互补和融合俨然成为工程教育领域研究者亟需关注的问题。

  湘潭大学自动化与电子信息学院、湘潭大学化学学院的杨一帆、段斌、旷怡、赵斌,在2023年第1期《电气技术》上撰文,聚焦于因果推断,将其迁移运用到工程教育领域为教师教学方案提供参考,基于工具变量法构建专业课程支撑非技术类毕业要求评价的因果推断模型,利用Stata软件分析和研究专业课程“高分子材料”双语教学支撑毕业要求沟通能力的因果效应。研究结果表明,本文方法可指导调控课程教学方案,为增加工程教育产出提供科学规范的数据支撑,从而为工程教育赋能并助力教育治理智能化。

  

  随着教育智能化进程的加快,智能教育体系正逐渐建立起来,原有的教育测评模式已经难以满足信息化时代教师对学生进行毕业能力评估的需求,人工教育评估不仅耗时耗力、效率较低,而且混杂主观因素,课程支撑评价的落实和改进是当前最大的挑战,对于评估结果的客观性和有效性的验证仍是亟待解决的问题。

  因果推理是人工智能实现从感知到认知需突破的关键问题,对构建可解释的模型至关重要,当开始谈论人类智能的自动化时,因果模型就从奢侈品变成了必需品。在此背景下,关于因果关系的新科学作为新时代高校改革深化和创新的产物应运而生,人们迫切需要建立一个规范化的因果效应评价和验证体系。因果推断方法和课程支撑教育评价相融合不仅是教师参与教育治理的具象化体现,也是推动教育评价持续改进过程的助力。

  近年来教育量化研究数量与成果不断增多,但研究方法还停留于描述性和相关性阶段,缺乏因果解释力,这极大限制了运用经验证据指导教育政策制定的能力。教育评价类观察性研究往往涉及如何去混杂这样一个具有挑战性的问题,教师在进行教育评价的过程中有可能会忽略某些同时影响处理和结果的混杂因素,导致教师对课程支撑评价因果推断的偏差和决策错误,从而影响课程建设质量的提升,所以无论是教育政策的改善,还是教师课程教学方案的实施,都必须建立在因果推断产出的科学凭据上。

  因果效应测评将学生培养目标渗透糅合进专业课程人才培养方案和课程教学大纲的设计中,与工程教育专业认证学习成果评价相结合,工具变量法是观察性研究中广泛使用的控制不可观测混杂的方法,基于工具变量的引用解决遗漏变量偏误是因果推断性统计、效应评估和验证的关键。

  1.1 工具变量法的基本思想和理论

  介绍工具变量法前首先要介绍线性模型,线性模型是理论、应用统计学和计量经济学等最重要的工具,这里从一个最简单的回归方程引入工具变量法。

  Y=Xβ+U 式(1)

  举例而言,若Y为收入,X为受教育的年数,β为系数,U为混杂因子代表的误差项,有时混杂因子是已知的,有时只是疑似存在,以“潜伏的第三变量”形式出现。假设X与混杂因子U不相关,Y的变动有且只有X影响,但是实际情况并非如此。如果关心教育对收入的因果作用,人的能力可能是很难测量的混杂因素,因为个人能力的高低同时与受教育年限和收入都具有相关性。

  例如,一个人受教育时间增加一年与其年收入增加5000元相关,那么就不能确定增长的工资中受教育年数和个人能力分别所影响的比例。在这种情况下,如果直接进行因果效应评测,就会受混杂因子个人能力的影响,如图1所示。

  图1 受混杂因子影响

  但工具变量法却并不一样,即使不能测量并调整U,依然可以用这一方法去估计X对Y的效应均值。然而观察性研究并不像随机试验一样有一个表示随机分组的变量,所以需要使用其他变量作为工具变量,用于处理混杂因素给因果推断带来的不利影响。

  引入工具变量如图2所示,工具变量Z和X之间不存在混杂,因此Z对X的因果效应可以根据X在Z上的回归线的斜率rXZ估计出来。同样地,变量Z和Y的关系也未被混杂,因为路径Z→X←U→Y被X处的对撞阻断了。因此Z在Y上的回归线斜率rZY就等于直接路径Z→X→Y的因果效应,即路径系数的乘积ab。因此有ab=rZY和a=rXZ,进而得到X对Y的因果效应:b=rZY/rXZ。

  通过上述步骤,工具变量就实现了在无法控制混杂因子或收集其数据的情况下估计X对Y的效应。在下面展示的案例中,将对专业课双语教学对非技术要素沟通能力进行因果测评,那么rXZ表征学生入学年份对专业课课程双语学习需求的影响程度,rZY表征入学年份对于非技术要素沟通能力影响的程度。其次,对于研究专业课课程教学对应的每一个非技术要素来说,都需找到与其非技术要素相契合的工具变量进行一一分析。

  图2 引入工具变量

  1.2 工具变量条件的剖析和工具变量的选取

  条件一:Z和X相关。如果Z和X之间的相关性很弱,那就是一个弱工具变量,这可能带来三个严重的问题:①弱工具变量会导致置信区间变宽;②弱工具变量会放大因条件二和条件三不成立带来的偏移,Z和X的弱相关性会使工具变量效应估计中的分母变小,而条件二和条件三影响的是分子,如果分子有偏移,那么这一偏移会被放大;③即使样本够大,弱工具变量也会带来偏移,并导致效应估计方差被低估,即效应估计是错误的,且置信区间较窄。

  条件二:Z仅通过X影响Y,而不能直接影响Y。在因果图中,如果有箭头从Z指向Y,就会直接作用于工具变量效应估计的分子,而这一额外部分也会被视为X的效应的一部分,影响因果效应的计算。

  条件三:Z和Y没有共同诱因。图3描绘了Z和Y 存在共同诱因的情形,其中U1不仅是Z和Y的共同诱因,也是X的诱因。在观察性研究中,Z的混杂总是存在。而混杂会影响效应估计里的分子,同时也会被视为X的效应的一部分,从而使分母扩大。

  图3 共同诱因情况

  对于本文研究的案例而言,学生对专业课程教学的投入程度及对跨文化背景下进行沟通和交流能力提升的意愿,受学生个人能力、发展预期和惰性等的混杂影响,例如爱好科研希望提高专业实践知识的“实验室大神”与有意向考公务员的学生区别明显。

  选取合理且有效的工具变量是工具变量法的关键,而工具变量既误差不可测,又不具备惟一性,所以寻找严格意义上独立于被解释变量、与误差项无关而与所替代的解释变量高度相关的工具变量十分困难。对于不同的内生性问题,可以采用不同的工具变量分别解决,对不同方向的偏估同时进行纠偏。本文以学校政策的变更为引,选取学生的入学年份作为工具变量,基于以下考虑。

  以湘潭大学为例,在对2021届毕业生施行的授学位政策规定条例中,将通过专利和软件著作权这两个条件去除,保留对英语能力的要求,于是提高了对学生英语能力的要求,对双语教学产生了因果效应,继而通过改变学生对专业课双语教学的积极性和参与度影响了沟通能力的评价结果,因此可用大学生入学年份作为工具变量。

  工具变量入学年份独立于遗漏变量偏误,其对沟通能力的效应完全来自双语课专业教学,这样保证其满足三个条件:①独立于混杂因子发展预期、惰性和个人能力等;②不会直接影响沟通能力的掌握度;③和专业课课程教学有一定的关联。

  1.3 因果推断模型的构建

  “高分子材料”是高分子材料与工程专业学生的一门必修专业课程,其双语课教学与课程支撑的毕业要求沟通能力指标点联系紧密,引入工具变量后的因果推断模型如图4所示。

  图4 因果推断模型

  1.4 线性回归模型的构建

  为了实现专业课教学对毕业要求指标能力的因果效应评价,基于因果链构建线性模型,将非技术类毕业要求指标点沟通能力评价值(point)作为被解释变量,能够较好反映双语教学效果的“高分子材料”课程支撑沟通能力毕业要求指标点课程目标达成情况评价值(pm)作为解释变量,增加变量学生性别(gender)进行参考和比较,回归模型为

  式(2)

  式(2)中:b0为常数项;b1、b2为系数;u1为误差项。

  2.1 数据来源和处理

  本文使用湘潭大学赵斌教授执教的高分子材料与工程专业2020~2021届1~3班毕业生成绩相关统计数据,目标样本规模为107人,并且通过不同形式的问卷与测试收集到个体样本专业综合设计对毕业要求沟通能力的定量评价、学生问卷定性评价、毕业后社会评价(用人单位和毕业一年左右毕业生调查结果)这三类数据,按学生个体根据各门专业课与社会评价对应权重计算得到支撑毕业要求指标点达成评价值,将其作为被解释变量,反映每个学生对于沟通能力的掌握度。并将“高分子材料”双语教学课程目标达成情况评价值、学生性别作为内生解释变量,学生入学年份作为工具变量。

  2.2 基本回归法

  普通最小二乘(ordinary least squares, OLS)法作为基本的回归方法,可以简便地求得未知数据,并使这些数据与实际数据之间误差的平方和最小,借此拟合出解释变量与被解释变量的相关曲线,得出因果估计量,但是此方法有对研究对象的影响因素考虑不全面和对混杂因子不可观测的局限性,这可能导致回归模型遗漏重要的解释变量。

  对于专业课教学影响能力评价值来说,由于混杂因子同时影响解释变量和被解释变量,相对整条因果链,其中的因果效应受到了局部的混杂影响,而OLS估计作为基本的线性拟合方法,在进行回归前的必要条件为所有解释变量与混杂因子同期不相关,不能消除这种内生性,下面的数据分析将采用OLS方法作为参照对象进行结果的对比和印证。

  2.3 工具变量回归法

  基于因果模型的效应表示,可以用双阶最小二乘(two-stage least squares, 2SLS)法拟合两个(饱和)线性模型,从而估计表达式中的分子和分母。其基本思想是通过工具变量切断自变量和残差的关系,解决内生性和反向因果问题,得到更加准确的自变量系数估计。具体地说,这种方法利用工具变量从专业课课程教学中分离出一部分与混杂因子无关的外生变异,分解成只有工具变量解释的部分和与残差相关的部分,并将该变异用于对毕业要求能力的回归估计,用工具变量对自变量的预测值来估计回归系数。

  2.4 基于Stata软件的结果指标数据评估和分析

  作为对照,先进行OLS回归,数据间相关性最重要的表现形式就是组群结构,现实中古典假设往往不成立。对于本文三个班的学生样本来说,处于一个专业集体会受到某些共同因素的影响,比如一个专业的学生由同一老师施教,或者受班级组群特征的影响,使集群内出现相互关联现象,样本观测值之间完全独立分布是不可能的,所以采用聚类稳健标准误,认为观测到的学生样本在一个集合或分布之中抽取,有且仅有同一聚类里的观测值具有相关性,此举旨在修正异方差,使模型回归系数显著性结果更加稳健、更加贴近现实,OLS回归结果如图5所示。

  图5 OLS回归结果

  可见OLS模型中,专业课双语教学对于学生沟通能力的因果效应比率的估计系数为0.328,在1.00%的显著水平上通过了t检验,且标准差为0.072,说明模型较为准确,样本均数抽样分布之间的离散和变异程度仍在合理的范围内。变量学生性别显著性没有通过t检验,所以认为变量性别对沟通能力的掌握度不具备因果效应,否定了当前工程类专业教育背景下学生性别的不同一定会带来沟通学习能力和迁移能力的差异性这种刻板思维。

  作为实验对象,引入学生入学年份作为工具变量,进行两阶段最小二乘回归,同样采用聚类稳健标准误,第一阶段回归结果如图6所示。

  图6 第一阶段回归结果

  从图6可以看出,F统计量=27.490>10,在实验中的有限样本范围内,根据经验准则可以判断,入学年份不是一个弱工具变量,工具变量入学年份成绩回归系数为0.187,标准差为0.025,在1.00%的水平上显著。

  第二阶段回归结果如图7所示。

  图7 第二阶段回归结果

  第二阶段回归结果为引入工具变量法对内生性问题进行解决之后得到的估计结果。从图7可以看出,拟合优度检验结果为0.166,此为扣除其他外生变量后解释变量专业课双语教学对被解释变量专业沟通能力评价值的解释力度,不涉及两者总体显著性关系的推断,双语课教学回归系数为0.370,标准误差为0.080,在1.00%的水平上显著,表明“高分子材料”课程双语教学对非技术类毕业要求沟通能力的因果效应估计量为37.00%。

  将基于同样样本数据的OLS回归和工具变量回归分析结果进行比较,从比较结果可以看出,由于内生性的存在,OLS估计量丧失了无偏性或一致性,使因果效应的实际估计量具有偏差,使用工具变量法消除混杂因子的偏倚后得到的估计量较前者增长了4.24%,说明混杂因子发展预期、学生未完成学习任务等和反向因果效应造成了约4.24%的估计量偏差,且校正后系数估计值37.00%更接近真实的专业课双语教学对毕业要求沟通能力的因果效应。

  其次,本文采用相同样本的数据,从解释变量方面进行对照研究,经过相同的流程和架构计算,得到的结果如下:

  1)将模型中专业课程双语教学课程目标达成情况评价值替换为大学英语成绩第一学年平均值进行对照,得出大学英语成绩和相同毕业要求能力指标点之间的因果效应为47.04%,相比效应增加10.04%。

  2)将模型中专业课程双语教学课程目标达成情况评价值替换为期末评价成绩进行对照,得出期末评价成绩和相同毕业要求能力指标点之间的因果效应为33.61%,相比效应减少3.39%。

  2.5 与瓦尔德估计法的比较和印证

  瓦尔德估计法作为传统的理论基础方法,是所有工具变量估计值的基础,较为直观地使用工具变量解决遗漏变量偏误,已知Z满足工具变量的三个条件,并且是一个二分变量,那么在加法尺度上,X对Y的因果效应估计就可以用条件期望表示为

  式(3)

  基于同样的样本数据,使用瓦尔德估计法计算得出双语教学对沟通能力的因果效应估计量为35.354%,这个估计值和2SLS估计值相似,印证了工具变量回归估计法的数据结论较为客观准确,原因在于两者都是依赖相同的信息构造出来的:由于入学年份不同导致沟通能力掌握度的差别。

  与双阶最小二乘法结果有较小差距的原因在于忽略了异质性带来的偏误,每个学生因个人因素接受相同双语教学而获得相同的沟通能力是不现实的,而工具变量回归法的优势在于模型中包含加入的初始变量,它会限制解释变量在协变量各分层中的变化情况,同时允许解释变量组中的因果效应随Z而变化,这样就能放宽双阶最小二乘法中的参数假设,得到更准确的效应估计。

  根据反映结果解释专业课程双语教学支撑评价可能存在的问题如下:

  1)实验运用算法定量地得到了专业课双语教学对非技术类毕业要求沟通能力培养的因果效应估计量,直观地表明了教学中学生受惰性影响而参与度低、发展预期和个人能力等混杂因子作用使因果效应估计出现了4.24%的遗漏变量偏误。

  大学英语课程和专业课程双语教学的效果存在强关联,在产出导向课程体系中,毕业要求能力指标点提出认知需求,专业课程教学负责提供认知供给,提高并显性化表达这种关联性正是一种基于学习产出的教育模式(outcomes-based education, OBE)理念的教学改革,要明确专业课程在课程支撑评价体系中的关键作用,针对性地引导学生积极性,加强与学生互动,及时了解学生对知识的理解掌握和应用情况,跟踪督促作业完成较差的学生,提高其学习效果,增加其课程教学活动参与度,减少混杂因子影响,提升教学的有效性,进而实现毕业要求能力的培养。

  2)模型中解释变量专业课程支撑沟通能力毕业要求课程目标达成情况评价值替换成大学英语成绩之后,因果估计量增长较多,反映出大学英语作为本专业先修基础课程,对于毕业要求沟通能力的培养效果更好,佐证了先修基础课程在课程支持评价体系中的指导性作用。

  3)模型中解释变量专业课程支撑沟通能力毕业要求课程目标达成情况评价值替换成课程教学期末评价成绩之后,相应因果效应减少,但差距不明显,体现了一定的教师产出导向教学效果,但仍有改进空间。为此,教师应严格按能力产出考核和评价、客观和科学地选择专业课支撑毕业要求的课程目标达成情况评价的支撑数据。

  基于自然实验的因果识别方法的探索与推广极大地改变了社会科学的实证研究范式,工具变量法可以消除选择偏误从而捕捉到真实的平均处理效应,是最有力的工具之一。本文尝试将工具变量法引入工程教育领域课程支撑毕业要求的评价中,解决专业课支撑非技术类毕业要求因果效应评测中所存在的学生积极性和参与度等混杂因子不可观测的难点问题,为工程教育研究提供一种定量描述和评估课程教学对非技术类要素能力培养因果效应的方案。

  研究表明,选取合理且有效的工具变量是工具变量法的关键,需要满足影响因果渠道、独立性假设、排他性约束等三方面要求,所以寻找严格意义上独立于被解释变量、与遗漏变量偏误无关而与所替代的解释变量高度相关的工具变量十分困难。

  本文研究案例采用的工具变量利用了高校变更授学位政策的随机性,能满足工具变量的三项要求,研究结果表明该方法具有良好的评价效果。下一步将在全校范围内研究更多的专业课双语教学支撑沟通能力非技术类毕业要求的课程教学案例,从更普遍层面分析该类教学目标的因果效应,发现存在的问题,提出持续改进建议。

  本文编自2023年第1期《电气技术》,论文标题为“工具变量因果测评方法在工程教育领域的应用研究”,作者为杨一帆、段斌 等。

  举报/反馈