第六章 护理教学评估评价
 
  第一节 概述
  第二节 教学评估
  第三节 教学评价
  第四节 试卷的编制及质量分析
第一节 概述

  一、评价的相关概念
  (一)测量、评估与评价的概念
  1.测量 是根据一定的规则,对事物进行量的测定,是一个数量化的过程。
  2.评估 相当于测量,它除了可用于对事物进行量的测定外,还可以用于测定事物非量化的价值。
  3.评价 是判断个体特性价值的过程,即对照一定的标准进行判断。
  三者关系
  ①“测量一般用于可量化的事物,而评估则既可用于可量化的事物,又可用于非量化的事物;
  测量和评估的本质是事实判断,即客观存在,事实判断是以客体的本质和规律为对象,它探讨客体是怎样的是什么,探讨事物的现象、本质和规律等属性;
  在测量或评估获得信息资料的基础上,才能开始评价的过程,评价是依据一定的标准进行事物的价值判断,因此评价实质上是价值判断。
  (二)教学测量、教学评估与教学评价概念
  1.教学测量 是指应用测量手段对教学活动所做的量的测定。对教学投入、教学过程、教学结果、学生的能力等方面通过教学测量获得资料。
  2.教学评估 是对所设计的评估内容,根据一定的评估标准进行测量,并对测量结果进行统计、分析、整理、归类的过程。
  3.教学评价 是参照现有的教学目标,通过系统地收集信息,采用科学的方法对教学活动中的事物或人作出综合价值分析和判断的过程。
  二、教学评估与评价的发展
  (一)萌芽期
  教学评价的主要对象是学校的教学成就和效率,评估和评价的依据是学生各种能力测验的数据,评估和评价的主要手段是教学测量。
  (二)形成期
  教学评估与评价的形成期的突出特点是出现了以教学目标为依据的泰勒评价模式,形成了一套比较完整的学校评价体系,学校的鉴定制度日趋完善。
  泰勒教授进行了课程与评价的研究,这也就是美国教育史上最著名的八年研究
  为了鉴定八年研究的成果,泰勒教授于1942年提出史密斯-泰勒报告:只有用教学评估的思想和方法,才能达成新课程的目标,才能实现全面发展人的才能的目标。
  同时美国在这一阶段对学校鉴定工作也得到正常发展,教学评估和评价涉及到教学活动的各个领域,评估和评价的主要手段除了教学测量外还包括观察、调查等多种方法,评估和评价更加注重系统性和综合性。
  (三)发展期
  多种评价方式,百家争鸣。
  三、教学评估与评价在护理教学中的意义
  现代教学评估、评价的主要功能和根本意义,既不在于鉴定和选择,也不在于对学生进行警戒与鞭策,而在于根据一定的教学目标和标准通过系统地搜集教学过程的主要信息,准确地了解实际情况,进行科学分析,对办学水平、教学质量作出评价,为改进工作、开展教学改革和改善宏观的教学管理提供依据。
第二节 教学评估

  科学的评估对护理教学具有鉴定、诊断、反馈、沟通、向导、激励、监督和决策的作用。
  一、教学评估的分类
  1.正式评估/非正式评估
  2.定量评估/定性评估
  3.外部评估/内部评估
  4.诊断性评估/形成性评估/总结性评估
  诊断性评估:是指在一项教学活动开始之前所做的评估,其目的是确定被评估对象的状态水平、存在问题等,即确定问题;
  形成性评估:是在教学活动运行过程中随时进行评估,其目的是为了改进,即随时了解动态的教学过程,反馈信息,以便及时强化、及时调整,使教学活动在不断地监控中不断完善,以便顺利地达到预期目标。
  总结性评估:则是在教学过程某一阶段终结时,为对其总体状态和阶段效果进行的评估,其主要作用是进行阶段性总结,总结性评估强调结果,为今后改进提供依据。
  二、有效评估的标准
  1.真实性 真实性又称效度,效度是指评估的有效性,即一个评估的结果与欲要评估(测量)的属性之间相符程度的指标。
  效度一般可分为三大类:内容效度、结构效度和效度标准关联效度。
  2.可靠性 又称信度,它反映评估的稳定性,代表所得到资料的稳定程度。评估工具多次对同一组对象评估的结果或所得到的资料相同的程度。
  信度的主要作用:
  一是可用来估计评估结果的可靠性,一般标准化评估其信度应在0.90以上,通常要达到0.95
  二是可以帮助教师提高设计评估工具的技能,通过对评估结果信度的分析,发现评估工具中的缺陷。
  3.区别性
  区分度是指评估对被评估对象反应水平的区分程度和鉴别能力。
  4.实用性 也称为可行性。
  三、常用的教学评估方法
  在护理学专业教学中,常用的评估方法包括观察法、笔试试卷、书面作业、口头报告、口试以及操作考试等(有关试卷的编制将在本章第四节中详细介绍)。
  四、临床能力评估
  (一)学生临床能力评估的内容
  1.认知领域 评估学生知识的掌握程度,分别从知识、理解、应用、分析、综合、评价的层次收集学生掌握知识的情况。
  2.情感领域 评估收集学生在临床学习中的信念、敬业精神、学习态度、团结协作、仪表和对待患者的态度等方面的信息。
  3.精神运动领域 临床操作技能。
  (二)常用的临床能力评估方法——观察法
  (三)影响临床能力评估的因素
  1.评估人
  评估人的态度; ②评估人的动机;
  评估人的主观因素;评估人的经验;
  其他
  2.评估对象
  内容的准备程度,以及评估时的焦虑水平。
  3.评估方法
  间断评估法、连续评估法
  (四)评估临床能力时的注意事项
第三节 教学评价

  一、概述
  教学评价是依据一定的教学目标,运用科学手段,对教学活动过程及其效果进行价值判断,从而为教学决策提供依据的全过程。
  教学评价主要功能:
  导向功能; ②调节功能; 激励功能; ④鉴别功能。
  二、教学评价模式
  1.行为目标评价模式:泰勒创建
  2.CIPP评价模式:美国学者斯塔弗尔比姆
  CIPP评价模式的特点是以决策为导向,重视评价的改进功能,同时将诊断性评价、形成性评价、终结性评价完整地结合在一起,充分发挥了评价导向和改进的职能。
  3.目标游离评价模式:斯克里芬
  4.对手评价模式
  5.哈蒙德模式
  三、教学评价过程
 
  四、教学评价内容
  (一)课程评价
  对课程的评价可能涉及以下内容:
  1.课程目标是否合适并且是否达到。
  2.课程结构、进度和连续性如何。
  3.课程大纲的实用性与现实性。
  4.教学方法的质量与效果。
  5.课程结束后学生的能力。
  6.课程目标是否进行了检验,在学生成绩方面评价的效果如何。
  7.工作人员的进取心及凝聚力。
  8.提供的资金及资金利用。
  两种主要的收集资料方法——定量法与定性法。
  (二)教师教学质量评价
  在教学过程中可以通过对教师的教学态度、教学水平、教学方法和教学效果4个方面的评价来判断教师教学质量的高低。
  参与评价的可以是教学管理人员、教师和学生,可以通过填写问卷、填写评价表和观察等方式进行。
  (三)教师授课质量评价
第四节 试卷的编制及质量分析

  一、试卷编制
  (一)试卷编制的过程
  1.标准化试卷的设计步骤
  试卷编制的基本步骤有确定考试的目的和测量目标、设计测验蓝图、决定试卷时限、决定试卷测验类型、决定试题数量、决定记分方法、拟定试卷题目、实施考试、分析试题难度与区分度、筛选试题拼题、建立题库、鉴定试卷信度与效度、编制试卷量表及编写试卷使用说明。
  2.试卷编制的基本原则
  (二)试卷中试题
  1.主观性试题
  论述题属于主观试题,它适用于评估高层次的认知功能,如应用、分析和评价,而不宜用于测试学生对所学知识记住了多少。
  可用以评估学生的态度、价值、观点等情感方面,如询问学生对护理的看法等。教学评估
  (1)论述题的评分:
  绝对评分法——分析法:
  标准答案应指出各关键内容应给多少分或在总分中占多少比例。
  相对评分法——综合法:
  在运用相对评分系统时,常常采用综合法。综合法也要求有标准答案,但只是作为一种比较的标准。分数不以百分制计,而是以诸如非常好/好/一般/一般偏下/不好这样的等级来计分。
 
3)主观题的优、缺点
  主观性试题适用于评估高层次的认知能力,其优点有:
  A.考试对象可以自由作答,从不同的侧面、广度和深度进行自由发挥;
  B.可用于考察学生的理解能力、概括能力、判断能力、推理能力、创造能力以及对事物的评价鉴赏能力;
  C.一次进行多因素的综合评分,可间接用于态度和价值观的评估;
  D.命题比客观性试题容易。
 
主观性试题也存在一些不可避免的缺点:
  A.内容真实性低。在一次考试中,论述题往往只有几道,因此所涉及教学大纲要求的内容就很有限,大纲的覆盖率较低;
  B.分数可靠性低。    C.评分困难。 D.学生感到疲劳。  E.书写能力会影响分数。  F.选答会影响分数。
 
2)客观性试题
  客观题测试在评分人方面是完全可靠的;
  题量可较大,保证教学大纲中所要求内容的覆盖率,试卷内容的真实性也高;
  而且,答案固定可节省阅卷时间,可以储存于题库中供多次使用;不易使答卷人感到疲倦,因为回答客观题测试的速度比较快。
  但是,出一份客观测试的试卷,尤其是一份高水平的试卷往往需要花费很多的时间和精力。
 
1)客观试题的类型
  单选题 A型题 B型题(共用题干)
  多项选择题
  填空题
  (2)设计客观题试卷的注意事项:
  选择题的注意事项:主干部分应首先做到问题的陈述必须清楚;其次只给出必需的资料即可;再次可出些较难的题,以测试高层次水平。
  填空题注意事项:留出重要的词让学生填;在一句陈述中需填的字不能太多;保证题目本身是正确的。
  二、试卷的质量分析
  主要通过难易度、区分度、信度及效度等指标进行评价。
 
(一)试卷的难度
  难度是指试卷的难易程度,通常用难度指数加以描述。
  公式为:
  1.客观试题:
  PR/N
  其中P代表试题的难度;R代表答对的人数;N代表全体被测试人数。
  2.主观试题:
  P=某题的总平均分/该题满分值
  整个试卷的难度分布以0.350.65为宜。如果是为了选拔尖子学生,难度可以0.2O.4为宜。
 
(二)试卷的效度
  效度是指由数据所提供的差异反映出所要测量的各个项目之间的真实差异程度。
  内容效度:是否达到测量目标的要求,知识覆盖面和学习水平层次是否达到设计要求,还要看是否有偏题、怪题或过难过易的试题。
  效标关联效度
  效标关联效度是以一次认为是最有效的测验成绩作为效标,计算出本次测验成绩与效标之间的相关系数(以r表示),值在﹣1到﹢1之间。
  (三)试卷的信度
  试卷的信度是指试卷的一致性和可靠性的程度,
  内部一致性信度是本测验内部部分之间相关的程度,追求其等同相关系数。
  稳定性信度是指同一测验先后两次在同一被测总体中实施,两次测验结果的相关程度。
 
(四)试卷的区分度
  试卷的区分度是指试题区分被测的特征差异或鉴别其优劣、高低程度的能力。
  极端分组法计算区分度。
区分度
试题评价
0.40以上
很好
0.30O.39
良好,修改后更佳
0.20O.29
尚可,仍然需要修改
0.19以下
差,必须淘汰
(五)试卷质量的综合分析
  1.区分度与难度 难度值(P)越小,则区分度(D)越高,但是如果难度值过小,区分度反而下降;
  一般认为:难度值(P 区分度(D
  P0.5 D0.2 可以认为试题难度适中,区分度良好;
  P0.5 D0.2 试题偏难,但仍然有较好的区分度;
  P0.5 D0.2 区分度较差,如果内容是学生必须掌握的,试题尚可使用;
  P0.5 D0.2 无区分度,又过分难,应该放弃不用。
 
2.难度、区分度与信度
  各个试题的区分度越大,试卷的信度越大,也就是难度中等的题目组成的试卷的信度较大。
 
3.区分度与效度
  试卷的区分度是以测验的实际得分与测验总分的相关性来表示的,因此区分度越大,测验的效度也就越高。
 
4.试卷信度高是效度高的必要条件
  具有较高的效度,必须具有较高的信度;而较高的信度不能保证必定具有较高的效度。
 
 练习题
  单选题
  采用计算方法,对评估的内容进行数量化的过程属于    A
  A.定量评估  B.定性评估   C.过程性评估  D.总结性评估
 
  试题的区分度为0.37,表明该试题  B
  A.很好
  B.良好,修改后更佳
  C.尚可,仍然需要修改
  D.差,必须淘汰
 
  形成性评估通常是为了
  A.在一项教学活动开始之前发现其存在的问题
  B.在教学活动运行过程中随时了解动态的教学过程
  C.在教学过程某一阶段终结时进行阶段性总结
  D.在教学活动过程中,选拔优秀的学生      B
 
  根据评估过程中主体、客体关系可将评估分为    A
  A.外部评估和内部评估     B.宏观评估和微观评估
  C.定量评估和定性评估     D.正式评估和非正式评估
 
  通过实际的技术操作获得评估学生临床操作技能的资料,评估的内容层次属    C
  A.认知领域  B.情感领域    C.精神运动领域    D.思维领域
  为了选拔尖子学生而进行的考试,其试题的难度区间应在  A
  A.0.2 0.4
  B.0.3 0.5
  C.0.4 0.6
  D.0.5 0.7
 
  多选题
  下列有关试题质量的描述正确的是    BD
  A.难度值大于0.5,区分度大于0.2,可以认为试题偏难,但仍然有较好的区分度
  B.难度值大于0.5,区分度大于0.2,可以认为试题难度适中,区分度良好
  C.难度值大于0.5,区分度小于0.2,可以认为试题无区分度,又过分难,应该放弃不用。
  D.难度值小于0.5,区分度小于0.2,可以认为试题无区分度,又过于难,应该放弃不用。
  E.难度值小于0.5,区分度大于0.2,可以认为试题难度适中,区分度良好。
 
  效度一般可分为        BCD
  A.程度效度  B.内容效度  C.结构效度  D.效度标准关联效度  E.功能效度
  名词解释
  教学评价
   
教学评价是依据一定的教学目标(1分),运用科学手段,对教学活动过程及其效果进行价值判断(1分),从而为教学决策提供依据的全过程(1分)。
  测量    测量是根据一定的规则,对事物进行量的测定(1分),它是一个数量化的过程(1分),你给某一个体或事物的某种特性打分或计算。(1分)
 
简答题
  简要描述主观性试题的优点。
   
1)考试对象可以自由作答,从不同的侧面、广度和深度进行自由发挥(1分);
  (2)它可用于考察学生的理解能力、概括能力、判断能力、推理能力、创造能力以及对事物的评价鉴赏能力(2分);
  (3)一次进行多因素的综合评分,可间接用于态度和价值观的评估(1分);
  (4)命题比客观性试题容易(1分)。

  论述题
  以单项选择题为例,论述如何设计客观题试题。
  
1)单项选择题包含3部分,题干部分,答案部分和干扰项部分为试题的选择项(1分);
  (2)主干部分应做到:问题陈述必须清楚(1分),只给出必需资料(1分),可出些较难的题(1分);
  (3)选择项应做到:3个或3个以上(1分),按逻辑或数字顺序排列(1分),避免重复,应是同类性质的内容(1分);
  (4)干扰部分应含有粗看似乎正确的内容(1分),并避免使用与问题毫不相干的陈述(1分);
  (5)答案部分应是唯一正确的答案(1分)。