第七章教育测验与评价

  教育测量包括了从身体身体素质到兴趣态度等多个方面,如果说测量回答了有多少的问题只考察量的大,评价包含定性描述或价值判断更多的时候是两者兼而有之,升学考试就体现了测验的选拔功能如高考评定功能。

  第七章教育测验与评价

  第一节教育测验

  一、教育测验的概念

  (一)概念界说

  测量是给事物的某种属性给定数值的过程,回答了“有多少”的问题。教育测量包括了从身体身体素质到兴趣态度等多个方面。

  测验是对于知识水平、情意状态、运动技能等的数量化测定,有广义和狭义之分。狭义的测验仅指一份测验卷子,而广义的测验指编制试题、施测、评分到报告成绩的全过程。在教育领域,测验只是测量的一种形式,主要用来测量学生的学业成绩和心理特点。如果说测量回答了“有多少”的问题,只考察量的大小,测验则回答了“某个人做的怎么样”的问题,包含了对测验结果的解释和评判。

  规范的考试是教师在教学过程中编制试题、评定学生学业成绩的过程,如期中、期末考试。它与测验的区别有两种看法。第一种是从教育测量学中引出,认为测验更为规范,从试题编制、实施测验测验到评分过程都有严格的程序,而考试则是教师可自行安排,相对灵活,技术要求不高的测验形式。另一种观点与第一种正好相反,认为测验比较随意,而考试则较为正式。本书主要采用第一种观点。

  评价是对某种教育活动的价值判断。评价包含定性描述或价值判断,更多的时候是两者兼而有之。

  (二)测验的功能

  测验具有以下功能:(1)激励功能;(2)诊断功能。诊断性测验主要考察两个方面,一个是看基础打得好不好,可否满足学习某种新知识的需要,另一个是看理解和掌握上有什么错误及其原因所在,它为教学提供了丰富的反馈信息,使教师能及时调整教学;(3)区分和选拔功能。升学考试就体现了测验的选拔功能,如高考;(4)评定功能。

  二、测验的类型

  从测验目的上考虑,可以分成安置性测验、形成性测验、诊断性测验和总结性测验。从测验内容上考虑,可以分成成就测验和学能测验。从规范程度上区分,可以分成标准化测验和教师自编测验。从结果解释所参照的标准区分,又可以分成常模参照性测验和标准参照性测验。

  (一)安置性测验、形成性测验、诊断性测验和总结性测验

  安置性测验的根本目的是分班、分组。安置性测验涉及的范围比较窄,难度也比较低。

  形成性测验针对某一教学单元而设计,在教学过程中进行,其目的不在于评定学生,而是为了调控教学。诊断性测验能够反映学习中常见的错误,诊断学习困难,特别是找到困难的成因。诊断性测验的目的是发现问题,评分不作为正式成绩。

  总结性测验用于对学生学习情况的阶段性总结分析。在一个段落或一门课结束后,教师会编制一套试题,

  全面考察学生的掌握情况。现行小学学科测验多采用闭卷形式,有时候也要求学生完成实践性课题。

  (二)标准化测验和教师自编测验

  标准化测验在试题编制、施测和评分过程中有着严格的规范。标准化测验是由测验专家和教师共同编制的,试题质量较有保障。最典型的标准化测验是智力测验,如“比奈智力量表”。

  教师自编测验是教师自己编制的测验,是在教学过程中针对教学实际引用现代测验原理编制的。教师自编测验针对性、灵活性强,能反映实际教学中遇到的特殊问题。

  (三)成就测验和学能测验

  成就测验是对学生学业成绩的检查,常结合具体学科而设。学校平时的课堂测验,期中、期末考试等,都是成就测验。

  学能测验,又称学能倾向测验,它考察学生在课程学习中所获得的能力,与学业成就有较大关系。学能测验不局限于某门课程,关心各门课程都需要具有一般能力,主要包括文字推理测验和数字推理能力测验。学能测验一般在小学毕业前进行,能在一定程度上预测学生的发展潜力。

  学能测验与成就测验的区别在于,成就测验针对具体的教学内容而定,着重考察知识的掌握情况;而学能测验的测验内容比较宽泛,侧重于能力考察。

  (四)常模参照性测验和标准参照性测验

  常模参照性测验是按照在特定群体中的相对位置决定成绩的好坏。选拔性考试一般是典型的常模参照性测验,如高考。常模参照性测验要在所定教学内容中,选出一些能区分出学生水平的题目,它不一定要面面俱到,但应该能拉开分数距离。题目难度以中等为宜,特别难和特别简单的题目要少一些。

  标准参照性测验是考察是否达到了预先规定的标准,类似于各种执照考试,如驾驶执照考试。这种测验只关注考生是否达到了应该达到了应该达到的水平,而不去管别的考生怎么样。确定“合格”或“掌握”的标准是标准参照性测验能否取得成功的关键。标准参照测验往往是针对某几个特殊的知识点而设计,题目覆盖面广,并尽可能把所学的重要知识都反映出来。标准参照性测验不去刻意拉开学生间的距离,题目该难就难,该易就易,完全随知识点的要求而定。

  常模参照性测验和标准参照性测验的区别是:前者着重同学间的比较,后者关心有没有达到预定的学习目标。常模参照性测验适用于选拔性考试和总结性评定;而标准参照性测验适用于诊断和发现学生的不足,从而为改进教学提供反馈信息。

  三、良好测验的标准

  好的测验都应当符合一定的要求,通常用实用性、信度、效度、难度和区分度等指标衡量测验质量。

  1.实用性

  实用性反映了试题的基本质量,其基本要求是便于组织,便于实施,节时省力。(便于组织。(2)测验便于

  实施。(3)容易评分。(4)结果要容易解释。

  2.可信度

  可信度又称信度,指测验结果的前后一致程度,表示了分数的稳定性和可靠性。具体要求是,先后两次用同样的试卷测查同一批学生,则两次测验的分数应该比较相近;对同样的答卷组织两次评分,评分结果相近。如果上述评分结果相差悬殊,就表示可信度很低。评分的客观性常用评分者信度来说明。

  3.有效性

  有效性在测量学上也称为测验的效度,指一个测验能测到预先想测的知识和能力的程度。估计测验效度的方法主要有两种:(1)内容效度,反映了题目对所考察内容的代表性问题。(2)效标关联效度,反映了测验分数和所选择的效标分数之间的一致程度。和信度相比,测验的效度更为重要。因为效度高的测验信度一定高。

  4.难度

  难度即测验的程度,提供了试题平均通过率的信息。一份试卷的难度取决于每一道题的难度。难度用全体被试在某题的得分率(P)表示。如果全部通过,难度为1;如果谁都没有通过,难度为0。难度值在0到1之间,难度值越大,表示题目越容易。高分段人数少,低分段的人数多,表示难度较高。高分段的人数多,低分段的人数少,表示难度较低。难度中等时,最容易拉开考生间的档次。不同的测验对难度有不同的要求,如选拔性考试难度以中等为宜,否则很难筛眩一般来说,某一道试题答对的学生少于20%时便是过深,答对的多于80%时则是偏浅。

  5.区分度

  区分度是测验能否拉开分数距离的指标。试题的区分度也称为鉴别力,表示某道题目能够将不同程度的学生鉴别开来的能力。试题难度直接影响区分度,特别难的题目大家都不会做,特别容易的题目大家都会做,这两种题目区分度都很低。反之,中等难度的试题的区分度比较高,难度为0.5的题目,区分度最大。

  四、测验的编制和实施

  (一)确定试题内容

  在选择试题内容时,应设计测验蓝图。测验蓝图包括确定测验目的、测验内容以及编制双向细目表等内容。

  (1)确定知识点。(2)确定认知水平。(3)设计双向细目表。双向细目表是由教学内容和教学目标构成的的。

  (二)选择试题类型

  课堂测验的题型有客观题和论文题两种。客观题包括填空、判断正误和多项选择等题型。论文题包括简答题和论述题。因为客观题和论文题各具优缺点,所以搭配使用效果最佳。

  (三)评分

  计分方法可分为等级分和百分制两类。等级分在中国隋唐一代就广为使用,百分制则是20世纪初教育测量

  学的发展产物。等级制的计分方法除五分制和A、B、C、D、E外,还有许多变形。使用等级分的好处是避免了在同一分数等级上同学间的攀比,会减轻过分的分数竞争。但缺点在于,等级分比较粗略,不容易反映个体间细微的差别,评分尺度也较难把握。在评分时,教师要注意到自己对学生的看法可能会影响到评分过程。和百分制相比,等级制能避免“分分计较”的学习心理,减轻学生的考试负担。

  (四)测验分数的解释

  分数只有经过解释具有实际意义。解释分数时,既可以和其他同学的学习表现相比较,也可以和考核标准相对照。分数的意义是在比较中获得的。如同样考85分的两个同学,其分数值虽然相同,但反映出的水平和存在的问题并不完全相同。

  第二节中小学教育评价

  一、中小学教育评价概述

  最早的有组织的教育评价可以回溯到中国的科举考试。西方直到19世纪末期才开始实行正规的教育评价活动,早期评价研究主要集中在美国。赖斯的拼写测验是经典的评价研究,这项研究是在1895年到1905年的十年间在美国全面开展的。20世纪初,教育评价和教育测验发展很快,此期最有影响力的桑代克被称为现代教育测验之父。到了20世纪30年代,这一时期研究成为教育评价的里程碑。20世纪50年代,布鲁姆建立了教育目标分类学。直到现在,布鲁姆的教育目标分类学仍然是测验的重要指标体系。如果说测量给定了量的大小,评价则体现了价值判断的过程。评价是一种较主观的活动。

  广义的教育评价包括对于教育活动一切方面的评价,狭义的教育评价主要是对学生发展的评价,又称为学生评定。广义的评价较为笼统,狭义的评价关注教育效果而不看过程。

  二、中小学教育评价的类型

  从评价的严格程度上考虑,可以分成正式评价和非正式评价。从解释评价结果的标准上考虑,可以分成相对评价和绝对评价。从评价的功能上区分,可以分成形成性评价和总结性评价。

  (一)相对评价和绝对评价

  对应于常模参照性测验和标准参照性测验,评价可分为相对评价和绝对评价。相对评价是在群体中进行对比,这时衡量标准是相对的,如“矮子里拔高个”、“水涨船高”。绝对评价要和预定的标准相比较,只要达到了标准,就称为合格,如某种资格认证考试。

  (二)形成性评价和总结评价

  对应于形成性测验和总结性测验,评价可分为形成性评价和总结性评价。形成性评价是指在活动过程中,以改进工作为目的而开展的评价。通过揭示问题和反馈信息,这种评价对改进工作质量很有帮助。总结性评价是对活动结果的评价,它的目的在于评判活动效果。形成性评价和总结性评价在评价技术上并没有差别,只是实施过程不同。前者贯穿于活动的全过程,以改进工作为目标;后者要等到活动结束时才进行,

  目的是为了鉴定分等。

  三、中小学教育评价的内容

  在宏观范围,教育评价涉及教育目标、教育结构、教育管理体制等方面。在中观层面,包括教育队伍、办学条件、学校各项工作。微观层面则关注学生的学习和发展。在小学教育活动中,学生发展评定、教师授课质量评价、课程和教材评价是最主要的评价活动。此外,诊断学校中存在的特殊问题,评价教改实验,评估学校的总体表现也较为常见。

  (一)学生发展评定

  学生发展是衡量学校办学水平的关键指标。评定学生要考虑许多方面。最基本的有学业成就、行为表现和身体状况三方面,即德育、智育和体育。学业成就不仅包括学生在知识领域的学习成绩,还包括技能和情意领域的学习表现。行为表现评价也就是操行评定,用以考察学生在道德品质和行为处事上的优点与不足。操作评定应考察学生在伦理道德、品德修养和性格特点三方面的特征和表现。身体状况评价包括体质、体力、精力、卫生习惯和良好的生活方式等方面。

  (二)教师授课质量评价

  进行授课评价时,首先要确定评价的标准,这个标准要明确、具体、相对独立,要能够全面衡量教学的各个方面。实施授课质量评价标准一般有以下方面:(1)教学目标完成情况,(2)学生的课堂参与,(3)内容安排,(4)教学方法,(5)语言表达,(6)教学原则。具体到每一个方面还应当具体化。教师授课质量评价包括专家、同行、学生和自我评价。现代教育评价强调教师要增强自我评价意识,加强评价的形成性功能。在中小学教学实际中,多采用听课、评课的深入交流形式评价授课质量。不是局限于固定的评价指标,要能够结合具体的情况分析教学的特色和问题。对中小学教师来说,评课是很重要的一种能力,因为评课是教学常规的一部分。

  (三)课程和教材评价

  四、中小学教育评价的基本步骤

  评价的关键是建立评价目标,并在此基础上通过收集和整理资料,判断目标的达成情况。要想评价小学生的作文能力,就要分析小学作文教学的目标,并在此基础上建立评价标准。然后选择一些学生,考察他们的作文水平。最后要比较学生实际作文水平和教学目标的差距,分析作文教学中到底存在哪些问题。

  (一)建立评价目标

  现代教育评价的总目标可概括成以下类别:(1)直接与学业成就有关的评价目标,包括知识和技能目标;情意目标。(2)间接与学业成就有关的评价目标。包括学生的智能、性向等;学生的环境;身体的评价目标。

  (二)选择评价样本

  收集评价信息的方法主要有观察、问卷调查和访谈、检查作业、考试、家访和轶事记录法等。

  (四)报告评价结果

  要具备以下内容:评价目标、时间、人员、方法、结果和建议。

  五、当今评价的问题与发展

  (一)现存问题

  测验和评价的应用以激励学生和改进教学为目标,但实际教学中,某些教师往往用测验一个尺度,从学业成绩一个方面衡量学生的发展水平,这样不仅会妨碍学生的全面发展,也会对教学改革形成阻力。有以下问题:(1)重知识轻能力。(2)片面追求分数。(3)影响学生心理健康。(4)制约教学改革

  (二)发展和改革对策

  现代教育评价具有以下特点:(1)注重评价的形成性功能,(2)注重定性和定量相结合的评价方法,(3)倡导自我评价,(4)尊重评价对象的感受。

  1.从侧重一元评价到多元评价

  以测验成绩为主要尺度,这样的评价模式就是一元评价。从多视角,采用多种方法评价学生就是多元评价。在多元评价的思想下,教育要关注学生整体能力的提高。教师不仅要在观念上树立多元评价的思想,实践上还要费一些心思。(1)重视高层次认知能力的考察。(2)重视对学习过程的检测。(3)注重对各种活动表现的检测。(4)用多种方法收集评价信息。

  2.从侧重总结性评价到形成性评价

  从选择适合教育的少年儿童创造适合少年儿童的教育,是评价观察上的一大变革。总结性评价重在发挥鉴定和筛选功能,评价主要是为了衡量学生的好坏。相反,形成性评价所关心的是能不能指向提高—学校的发展,学生的进步。在当前的小学教育实践中,形成性评价已经是比较主流的评价方法。

  3.从侧重区分性功能到发挥激励性功能

  第十二章教育测验与评价

  本章重点

  1.什么是考试?

  2.什么是标准化测验?

  3.良好测验的标准有哪些?

  4.什么是教育评价?

  5.什么是总结性评价?

  6.如何对教师授课质量进行评价?

  7.当今中小学教育评价存在的问题及改革发展的策略是什么?第一节中小学教育测验

  一、教育测验的概念〔p363-364〕

  1、考试的含义〔P.363〕(名解2006.10)*

  教师在教学过程中编制试题、评定学生学业成绩的过程

  2、测验的功能:激励、诊断、区分选拔、评定。(多选)

  激励功能可采用哪些方法达成?

  (1)将课程分成小单元,即时激励

  (2)扩展评价范围,各显长项

  (3)记录学生学业之外的突出表现,增加学生成就感

  (4)注重学生发展过程中的纵向评价

  二、测验的类型〔p364-367〕

  1、按目的分:(单、多选)

  (1)安置性测验:分班分组。如摸底测验。

  (2)形成性测验:调控教学。如单元测验。----“反应学生在群体中的地位”

  (3)诊断性测验:发现问题。

  (4)总结性测验:阶段总结。如期末测验。

  2、按规范程度分:

  (1)标准化测验:如智力测验。(名解2016.10)*

  (2)教师自编测验。

  3、按内容分:(单、多选)

  1

  (1)成就测验:学生具体学科的学业成绩检查。

  (2)学能测验:学习中形成的一般能力的检查。如公务员考试。

  4、按解释的参照标准分:(单、多选)

  (1)常模参照测验:与特定群体的平均水平比较得出相对位置。如高考。

  (2)标准参照测验:与预先规定的标准比较是否达到应达到的水平。如高中毕业

  会考。

  三、良好测验的标准〔p368-370〕(简答2004.4,多选)*

  1、实用性:便于组织、实施,节时省力。

  2、可信度:测验结果的前后一致程度。(单选)

  3、效度:测验能测到预先想测的目标的程度(指标中更为重要)。(单选)

  4、难度:试题平均通过的程度。

  5、区分度:能否拉开分数的距离。(单选)

  第二节中小学教育评价

  一、中小学教育评价概述

  1、评价的历史:〔p375-376〕(单选)

  (1)中国的科举考试――最早的有组织的教育评价。

  (2)桑代克――现代教育测验之父(与泰勒—“现代课程理论之父”区别)

  (3)布卢姆――建立了教育目标分类学。

  2、含义:〔p376〕(名解2005.4,2006.4)*

  教育评价就是利用所有可行的评价技术来评量教育所期望的一切效

  果,又可分为广义、狭义两种。广义的教育评价包括对于教育活动一切方面的评价,狭义的教育评价主要是对学生发展的评价,又称为学生评定。

  二、中小学教育评价的类型〔p377〕

  1、按解释评价结果的标准分:(单、多选)

  (1)相对评价:利用常模参照测验结果在群体中进行对比。如矮子里挑高子。

  (2)绝对评价:利用标准参照测验结果参照预定标准进行对比。如教师资格认定

  考试。

  2、按评价的功能分:(单、多选)

  2

  (1)形成性评价:过程中进行,目的是调整后继的活动使得活动尽量不偏离预定

  目标。

  (2)总结性评价:事后进行,目的是评价一个阶段活动的效果。(名解,2004.1)

  *

  三、中小学教育评价的内容〔p378-381〕(多选)

  1、学生发展评价:是衡量学校办学水平的关键指标。(单、多选)

  包括:学业成就、行为表现、身体状况3方面。

  2、教师授课质量评价。(简答2004.10)*

  3、课程和教材评价。

  四、中小学教育评价的基本步骤〔p382-385〕(多选)

  1、建立评价目标:评价的关键。(单选)

  2、选择评价样本:样本的代表性强不强取决于抽样方法。

  3、收集评价信息。

  4、报告评价结果。

  五、当今中小学教育评价的存在的问题与改革的策略〔p382-385〕(论述,2003.10)

  *

  1、现存问题:单纯从学生学业成绩这一个方面去衡量学生的发展水平,这不仅会

  妨碍学生的全面发展,也会对教学改革形成阻力。

  具体表现在:(多选)

  (1)重知识轻能力,助长死记硬背,加重学习负担。

  (2)片面追求分数,不利于激发学生内在的求知动机。

  (3)影响学生心理健康。

  (4)制约教学改革。

  2、发展和改革策略:(简答2005.10、2016.4)*

  遵循现代教育评价的基本特点,注重评价的形成性功能,注重定性和定量相结合,倡导自我评价,尊重被评价者的感受。

  (1)从侧重一元评价到多元评价,从多个视角、用多种方法评价学生。(具体4点

  见教材)

  (2)从侧重总结性评价到形成性评价,重视对学习过程的评价,使评价指向学校

  的发展和学生的提高。(具体4点见教材)

  (3)从侧重区分性功能到发挥激励性功能,坚持以找优点为评价的出发点,坚持

  以个体为主的评价标准,突出鼓励性评价,让学生体验成功。(具体4点见教材)(多选)

  本章真题练习№1

  单选(2016.4)教师在教学过程中编制试题、评定学生学业成绩的过程,是指(C)

  A.测量B.测验C.考试D.评价

  单选(2002.10,2003.4)为了分班、分组的目的所进行的测验是(D)

  A.形成性测验B.诊断性测验C.总结性测验D.安置性测验

  单选(2004.1、2004.4)以调控教学为根本目的的测验是(B)。

  A.安置性测验B.形成性测验C.诊断性测验D.总结性测验单选(2006.4)以发现问题、找出学习困难原因为目的的测验是(C)

  A.安置性测验B.形成性测验C.诊断性测验D.总结性测验单选(2003.4、2016.4)反映了学生在群体中的地位的测验是(C)。

  A.学能测验B.成就测验C.常模参照测验D.标准参照测验本章真题练习№2

  单选(2004.1)只关注考生是否达到了应该达到的水平的测验是(D)。

  A.学能测验B.成就测验C.常模参照测验D.标准参照测验多选(2003.4)良好测验的标准是(ABCDE)。

  A.实用性B.可信度C.有效性D.难度E.区分度

  单选(2016.4)良好测验标准中显示测验结果的前后一致程度,表示分数稳定性与可靠性的指标是(D)

  A.效度B.难度C.区分度D.信度

  单选(2016.10)在教学测验中先后两次用同样的试卷测查同一批学生,其结果前后一致,表示分数的稳定和可靠,这即是良好测验的(B)

  A.难度B.可信度C.效度D.区分度

  本章真题练习№3

  单选(2016.4)教育测验能测到预先想测的知识和能力的程度,这即是测验的(B)

  A.信度B.效度C.难度D.区分度

  单选(2005.10)能鉴别学业水平高低、能力强弱的测验表明其(D)很高。

  A.难度B.信度C.效度D.区分度

  单选(2002.4)“矮子里找高个”、“水涨船高”是一种(A)

  A.相对评价B.绝对评价C.定性评价D.定量评价单选(2002.4)从评价的功能上区分,中小学教育评价的类型可分为(C)

  A.正式评价和非正式评价B.相对评价和绝对评价

  C.形成性评价和总结性评价D.正确评价和错误评价

  本章真题练习№4

  单选(2003.4)在教学过程中,以改进工作为目的而开展的评价称之为(B)。

  A.总结性评价B.形成性评价C.绝对评价D.相对评价

  多选(2005.4)中小学教育评价的内容包括以下哪几方面?(ADE)

  A.学生发展评定B.管理水平评价C.学生活动效果评价

  D.教师授课质量评价E.课程和教材评价

  多选(2005.10)当今教育评价存在的主要问题有(ABCD)。

  A.重知识轻能力B.片面追求分数与升学

  C.影响学生心理健康,唯成绩是论D.制约教学改革,标准固定划一E.以上问题都不是问题

  多选(2004.10)教学实践中评价的激励功能可采用哪些方法达成?(ABDE)

  A.将课程分成小单元,即时激励B.扩展评价范围,各显长项

  C.重视对学习过程的检测D.记录学生学业之外的突出表现,增加学生成就感

  E.注重学生发展过程中的纵向评价

  第十二章教育测验与评价

  一、单项选择题((有时每题2分,共40分;大部分年份每小题1分,共20分)

  1.“矮子里找高个”、“水涨船高”是一种(A)。(02.4)

  A.相对评价B.绝对评价C.定性评价D.定量评价

  2.从评价的功能上区分,中小学教育评价的类型可分为(C)。(02.4)

  A.正式评价和非正式评价B.相对评价和绝对评价

  C.形成性评价和总结性评价D.正确评价和错误评价

  3.为了分班、分组的目的所进行的测验是(D)。(02.10)

  A.形成性测验B.诊断性测验C.总结性测验D.安置性测验

  4.以分班、分组为测验的根本目的是(A)。(03.4)(08.10)

  A.安置性测验B.形成性测验C.诊断性测验D.总结性测验

  5.反映了学生在群体中的地位的测验是(C)。(03.4)

  A.学能测验B.成就测验C.常模参照测验D.标准参照测验

  6.在教学过程中,以改进工作为目的而开展的评价称之为(B)。(03.4)

  A.总结性评价B.形成性评价C.绝对评价D.相对评价

  7.以调控教学为根本目的的测验是(B)。(04.1)

  A.安置性测验B.形成性测验C.诊断性测验D.总结性测验

  8.针对某一教学单元而设计,在教学过程中进行,其目的不在于评定学生,而是为了调控教学,这种测验是(B)。(04.4)

  A.安置性测验B.形成性测验C.诊断性测验D.总结性测验

  9.只关注考生是否达到了应该达到的水平的测验是(D)。(04.1)

  A.学能测验B.成就测验C.常模参照测验D.标准参照测验

  10.能鉴别学业水平高低、能力强弱的测验表明其(D)很高。(05.10)

  A.难度B.信度C.效度D.区分度

  19.以发现问题、找出学习困难的原因为目的的测验是(C)。(06.4)

  A.安置性测验B.形成性测验C.诊断性测验

  11.20世纪50年代,布鲁姆建立了(C)。(06.10)

  A.教学目标分类学

  C.教育目标分类学B.教育评价分类学D.教育测验分类学D.总结性测验

  12.教师在教学过程中编制试题、评定学生学业成绩的过程,是指(C)(07.4)

  A.测量B.测验C.考试D.评价

  13.良好测验标准中显示测验结果的前后一致程度,表示分数稳定性与可靠性的指标是(D)。(07.4)

  A.效度B.难度C.区分度D.信度

  14.(B)是对知识水平,情意状态,运动技能的数量化测定。

  A.测量B.测验C.考试D.评价E.总结

  15.通过测验,一是考察学生基础打得好不好,可否满足学习新知识的需要;二是考察学生在理解和掌握上有什么错误及原因所在,这是测验的(B)功能。

  A.激励功能B.诊断功能C.区分和选拔功能D.评定功能E.淘汰功能

  16.美国学者B.S.(A)提出的认知目标分类系统把认知领域的教育目标分为识记、理解、应用、分析、综合、评价六个层次。

  A.布鲁姆B.赖斯C.杜威D.泰勒E.布什

  17.从评价功能上区分,教育评价可分为(C)和总结性评价

  A.正式评价B.非正式评价C.形成性评价D.相对评价E.诊断性评价

  18.对应于常模参照测验和标准参照测验,评价可分为相对评价和(C)评价。

  A.形成性评价B.总结性评价C.绝对评价D.发展性评价E.正式评价

  19.在教学测验中先后两次用同样的试卷测查同一批学生,其结果前后一致,表示分数的稳定和可靠,这即是良好测验的(B)(07.10)

  A.难度B.可信度C.效度D.区分度

  20.反映了学生在群体中的地位的测验是(C)(08.4)

  A.学能测验B.成就测验C.常模参照测验D.标准参照测验

  21.教育测验能测到预先想测的知识和能力的程度,这即是测验的(B)(08.4)

  A.信度B.效度C.难度D.区分度

  22.布鲁姆的_____仍然是现在测验的重要指标体系。(B)(09.4)

  A.教学目标分类学B.教育目标分类学

  分类学C.教育评价分类学D.教育测验

  23.驾驶执照考试、体育达标测验都属于(D)(09.10)

  A.诊断性测验B.安置性测验C.常模参照性测验

  D.标准参照性测验

  二、多项选择题(每题1分或2分,共10分;如单项选择每题2分则无多项选择)

  1.良好测验的标准是(ABCDE)。(03.4)

  A.实用性B.可信度C.有效性D.难度E.区分度

  2.教学实践中评价的激励功能可采用哪些方法达成?(ABDE)(04.10)

  A.将课程分成小单元,即时激励B.扩展评价范围,各显长项

  C.重视对学习过程的检测D.记录学生学业之外的突出表现,增加学生成就感E.注重学生发展过程中的纵向评价

  3.中小学教育评价的内容包括以下哪几方面?(ADE)(05.4)

  A.学生发展评定B.管理水平评价C.学生活动效果评价

  D.教师授课质量评价E.课程和教材评价

  4.当今教育评价存在的主要问题有(ABCD)。(05.10)

  A.重知识轻能力B.片面追求分数与升学C.影响学生心理健康,唯成绩是论

  D.制约教学改革,标准固定划一E.以上问题都不是问题

  三、名词解释(每小题4分,共20分)

  1.总结性评价(04.1)P377

  总结性评价是对活动结果的评价,它的目的在于评判活动效果。这种评价具有事后检验的性质,一般是上级教育管理部门开展的评价活动,其评价结果会影响行政决策。

  2.教育评价(05.4)(06.4)P376

  广义的教育评价包括对于教育活动一切方面的评价,狭义的教育评价主要是对学生发展的评价,又称学生评定。

  3.考试(06.10)P363

  规范的考试是教师在教学过程中编制试题、评定学生学业成绩的过程,如期中、期末考试。

  4.标准化测验(07.10)P365

  标准化测验从试卷上看,并没有特别之处,但在试题编制、施测和评分过程中有着严格的规范,标准化测验是由测验专家和教师共同编制的,试题质量较有保障。

  5.安置性测验P364

  安置性测验的根本目的是分班、分组。在讲授新内容之前,教师常常要进行摸底测验,看看学生是否掌握了学习新内容所应具备的基础知识和基本技能。

  6.形成性测验P365

  形成性测验针对某一教学单元而设计,在教学过程中进行,其目的不在于评定学生,而是为了调控教学。

  7.诊断性测验P365

  诊断性测验能够反映学习中常见的错误,诊断学习困难,特别是找到困难的成因。

  8.相对评价(绝对评价)P377

  相对评价是在群体中进行对比,这是衡量标准是相对的,如某个老师教的好不好是通过和其他老师相比较而获得。

  绝对评价要与预定的标准相比较,只要达到了标准,就成为合格。

  9.形成性评价(09.10)P377

  形成性评价是指在活动过程中,以改进工作为目的而开展的评价。通过揭示问题和反馈信息,这种评价对改进工作质量很有帮助。

  10.评价P376

  评价是在特定信息的基础上,对事物某种属性的价值判断。

  四、简答(2004.4开始改为每小题5分,共25分,以前为每题6分,共30分)

  1.良好测验的标准。(04.4)(08.10)P368

  好的测量应当符合一定的要求,通常用实用性、信度、效度、难度和区分度等指标衡量测验

  质量。

  (1)实用性。实用性反映了试题的基本质量,其基本要求是便于组织,便于实施,节时省力。

  (2)可信度。可信度又称信度,是测验结果的前后一致程度,表示了分数的稳定性和可靠性。

  (3)有效性。有效性在测量学上也称为测验的效度,指一个测验能测到预先想测的知识和能力的程度。估计测验效度的方法有内容效度和效标关联效度两种。

  (4)难度。难度即测验的难易程度,提供了试题平均通过率的信息。

  (5)区分度。区分度是测验能否拉开分数距离的指标。试题的难度直接影响区分度,中等难度的试题区分度比较高,难度为0.5的题目,区分度不大。

  2.如何对教师授课质量进行评价?(04.10)P379

  授课质量评价能够让教师清楚知道自己的教学特点,了解长处与不足,也提供了新老教师相互学习的机会,对年轻教师的成长极为有益。授课质量评价可以从以下方面去衡量:(1)对新事物的感受,(2)教育分寸,(3)本学科的知识,(4)发展学生的思维,(5)培养学生的一般学习技能,(6)培养学生对学科的兴趣,(7)以个体方式对待学生,(8)学科课外活动的组织。

  3.中小学教育评价的改革策略。(05.10)(08.4)P387

  (1)从侧重一元评价到多元评价

  (2)从侧重总结性评价到形成性评价

  (3)从侧重区分性功能到发挥激励性功能

  4.简述如何进行测验的编制。P371

  (1)确定试题内容。设计测验蓝图,包括确定测验目的、测验内容以及编制双向细目表等内容。

  (2)选择试题类型。课堂测验的题型有客观题和论问题两种,两者各具有优缺点,所以搭配使用效果更佳。想在短时间内考察较多的知识点,最好采用客观题。想深入考察学生的能力,论问题的答案提供了更丰富的信息。

  (3)评分。计分方法可分为等级分和百分制两种。

  (4)测验分数的解释。解释分数时,既可以和其他同学的学习表现相比较,也可以和考核标准相对照。

  5.编制测验的要求是什么。P368

  好的测量应当符合一定的要求,通常用实用性、信度、效度、难度和区分度等指标衡量测验质量。

  (1)实用性。实用性反映了试题的基本质量,其基本要求是便于组织,便于实施,节时省力。

  (2)可信度。可信度又称信度,是测验结果的前后一致程度,表示了分数的稳定性和可靠性。

  (3)有效性。有效性在测量学上也称为测验的效度,指一个测验能测到预先想测的知识和能力的程度。估计测验效度的方法有内容效度和效标关联效度两种。

  (4)难度。难度即测验的难易程度,提供了试题平均通过率的信息。

  (5)区分度。区分度是测验能否拉开分数距离的指标。试题的难度直接影响区分度,中等难度的试题区分度比较高,难度为0.5的题目,区分度不大。

  6.中小学教育评价的基本步骤。P382

  (1)建立评价目标

  (2)选择评价样本

  (3)收集评价信息

  (4)报告评价结果

  五、论述(共25分;04.4以前每小题10分,共20分)

  1.请结合实际工作谈谈现今中小学教育评价存在的问题及改革策略。(03.10)

  现今中小学教育评价存在的问题P385

  (1)重知识轻能力

  (2)片面追求分数

  (3)影响学生心理健康

  (4)制约教学改革

  中小学教育评价的改革策略。P387

  (1)从侧重一元评价到多元评价

  (2)从侧重总结性评价到形成性评价

  (3)从侧重区分性功能到发挥激励性功能

  相关文章:

  下期小学班主任工作总结09-24

  六年级数学下期末复习计划08-10

  2017数学下期中学业水平测试08-16

  最新小学数学教学工作总结10-11

  下期语文教学工作总结(精选5篇)08-11

  六年级下期英语教学工作计划12-13

  小学数学教育教学随笔01-20

  小学数学教学改进措施05-04

  小学数学教学教案模板11-30

  小学数学教学工作总结 15篇01-14