预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10
亲,该文档总共51页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
第七章项目分析本章主要内容第一节项目的难度分析一、定义二、估计测题难度的方法随堂练习2、当人数较多时,对于选择题、是非题等二级计分的题目,我们也可以用极端分组法。先根据被试的测验总分把他们由高到低排序,然后在两端分别截取人数比例相等的(一般取27%的比例)高分组和低分组,分别计算两组被试在某个项目上的通过率,求其平均数作为该题目的难度指标:3、对于二级计分的题目,如选择题、是非题,被试有猜题(凭机遇答题)的可能,对于一个二重选择题,能力为0的被试仍有50%的可能性选择正确答案。对K重选择题,被试完全凭机遇答题而得到正确答案的可能性是1/k。鉴于机遇对选择题的影响,其实际难度与使用难度公式(P=R/N)计算的难度就有一定的差别,因此必须进行矫正。校正公式是:另外,这个公式在选择题的备选答案数互不相同,又要比较它们的难度时特别有用。例题:一个五选一的测题的难度指数是0.50,一个四选一的测题的难度指数是0.53,问哪一个测题的难度大?4、在心理测验中,有些量表是多级计分的,比如许多心理量表中常用5点计分法:从未有过、偶尔、有时、经常、总是,并分别给予1分,2分,3分,4分,5分。在学科测验中,像简答、论述等主观性试题,也是按照评分标准对正确的部分给予一定的分数。像这种非二级计分的测题,可用下列公式计算测题难度:5、项目难度的等距量表使用项目难度等距量表的理由:⑴测题的难度一般用答对某题的人数的百分比表示。百分量表是等级量表,而非等距量表。也就是说它只表示事物之间大小的关系,但没有相等的单位。用百分比P值作为难度指标,实际上是在顺序量表的水平上衡量题目的难度。⑵难度的等级量表是反序而行的,P值越大,项目越容易,这与我们的日常概念是相反的。P=0.5时,对应的Z=0,P=0.6时,对应的Z=-0.25,P=0.7时,对应的Z=-0.52.前两个Z值相差0.25,后两者相差0.27,显然差距是不相等的。由于Z分数的值有正有负,使用起来有诸多不便,为此美国教育测验中心(ETS)创立了一个量表,用希腊字母△做单位:△=13+4Z标准正态分布的全距一般包括6个标准差的距离,即从-3到+3,所以等距难度指数△量表的全距是1至25,平均数是13,标准差为4.P=0.9987时,Z=-3,故Δ=13+4(-3)=1P=0.9772时,Z=-2,故Δ=13+4(-2)=5P=0.8413时,Z=-1,故Δ=13+4(-1)=9P=0.5000时,Z=0,故Δ=13+4(0)=13P=0.1587时,Z=+1,故Δ=13+4(+1)=17P=0.0228时,Z=+2,故Δ=13+4(+2)=21P=0.0013时,Z=+3,故Δ=13+4(+3)=25由此可见,常用的Δ值域介于1-25之间,Δ值越大,试题越难;Δ值越小,试题越容易。三、测验的难度对测验的影响(P207)2、测验的难度会影响到测验的信度和效度。测验的难度过大或过小会使测验形成正偏态和负偏态,与正态分布相比,分数的离散程度都会变小,导致信度降低。信度低了会导致效度降低。另外心理特质的分布大多是正态的,只有当测验的平均难度是0.5时,测验分数的分布才会是正态,两者才能相互吻合,只有当测验分数的分布与心理特质的分布相吻合时,测验才能对不同心理特质水平的被试有最大的鉴别力,测验的效度才能达到最高。四、测验难度水平的确定⑵从测验的性质上看无论难度测验还是速度测验都要防止被试得满分,因为难度测验是考察被试的最高能力水平,速度测验是考察被试的最快反应速度。如果被试在这些性质的测验上得满分,我们就很难确定倘若题目比现在更难更多一些,被试将比现在多得多少分。因而,在速度测验中,题目的难度不应超出被试的能力水平,但题目的数量必须多到反应最快的人在规定时间内也做不完的程度,这样才能真正测出被试的反应速度。在难度测验中应该包括各种不同难度的题目,其中最难的题目几乎是所有被试都回答不上来的,这样在时间比较宽裕的条件下,才能真正测出被试的最高能力水平。第二节项目的鉴别力一、定义二、项目鉴别力的估计方法美国教育与心理测量学家艾伯根据鉴别力指数提出了一个评价题目优劣的标准随堂练习随堂练习随堂练习项目的鉴别力与信、效度的关系事实上测验的信度会随着鉴别力的提高而迅速的提高。鉴别力与信度的关系测验的鉴别力与难度的关系二、项目分析举例多重选择题的项目分析对选择项的反应模式应从以下几方面进行分析:⑴如果正确的备选答案被所有的受测者选择说明测题太容易或者可能项目提供了某种暗示,或者其他的答案错得太过明显。⑵如果某个错误答案无一人选择说明该选项不具有迷惑性,错得过于明显。一般而言,除非有2%以上的人选择,否则该备选答案应该修改或删除。⑶如果所有的被试都选择了同一错误答案