本文档介绍了Prometric内部心理学家用来评估和标记内部项目以进行进一步审查的一般准则。这些准则适用于那些使用经典测试理论的程序。
表格汇编和统计审查的要素 |
规格/标准 |
---|---|
1.项目难度范围 |
P值= 0.3-0.89(最佳)* |
2.项目歧视指标的目标值 |
rpBis> .20 |
3.估计内部一致性可靠性的目标范围 |
阿尔法> .80 |
4.分类一致性或可靠性估计的目标范围 | 利文斯顿> .80 |
可接受范围大于最佳范围,并在下面进行说明 |
项目难点的预期范围
P值= 0.30至0.89 |
---|
对Prometric员工进行培训,使其认识到各个p值既不代表绝对的,可重复的值,也不需要具体的解释。相反,Prometric心理学家会审查所有可用于评估趋势的项目分析信息。注意:仅p值不足以用于大多数项目解释。在做出项目处置决策之前,所有基本项目审核都会包含p值和rpBis。
p值(从难到难) | 项目解释 |
---|---|
1.00至0.96 |
最小测量值的不可接受项目必须标记为由中小企业删除或修订。 |
0.90至0.95 |
非常简单(可能不可接受)的项目:检查rpBis是否有足够的区别。可能需要审查我的中小企业。 |
0.89至0.80 |
相当容易(可以接受)的项目:检查rpBis以确认歧视。 |
0.79至0.40 |
难到中等容易(可接受)的项目:如果rpBis在规格范围内,则使用。 |
0.39至0.30 | 困难(可接受)的项目:仔细检查rpBis,如果rpBis在规格范围内,请使用。 |
0.29至0.20 | 非常困难(可能不可接受)的项目:检查rpBis是否有足够的区别。可能需要中小企业审查。 |
0.19至0.00 | 不可接受的物品:不适当的困难或其他缺陷。必须标记中小企业删除或修订。 |
当发现某个项目不重要时,开发人员会查看该项目的rpBis。如果rpBis高,则将给予更大的容忍度以使该项目继续检查。
项目区分指标的目标值
rpBis = 0.20至1.00 |
---|
Prometric心理学家使用Biserial(rpBis)点来确定每个项目的辨别力。像其他经典统计一样,rpBis的使用也不是一门精确的科学。在某些情况下,低rpBis值可能是由于特别高或低的p值,由于难以置信的干扰因素而导致的项目差异少,由于候选者的同质性而导致的得分低差异或得分分布极度偏斜造成的。因此,Prometric心理学家在审查项目分析时需要考虑几个统计数据。表3总结了开发人员在检查项目歧视时使用的准则。请注意,这些准则假定项目已正确键入关键字,并且候选样本足够大。
RpBis(强到弱) |
项目解释 |
---|---|
1.00至0.50 |
很强(可以接受) |
0.49至0.30 |
强(可以接受) |
0.29至0.20 |
可以接受(但可能需要审核) |
0.19至0.10 |
边际(可能是不可接受的)项目:仔细检查文本和干扰项。 |
0.09至0.00 | 弱项(不可接受):p值可能很高。标记以供中小企业删除或修改。 |
-0.01至–0.20 |
不可接受的物品:不适当的困难或其他缺陷。必须标记中小企业删除或修订。 |
表4列出了心理测量团队对各种范围的α系数使用的解释。
Α |
内部一致性可靠性解释 |
---|---|
小于0.60 |
需要新形式的不可接受的系数 |
0.60至0.69 |
系数差,需要修改或删除表格 |
0.70至0.79 |
可能需要表格审查/修订的边际系数 |
0.80至0.89 |
系数好 |
0.90以上 |
出色的系数 |
通过/失败决定的分类一致性或可靠性估计的目标范围
r = 0.80或更高 |
---|
Prometric选择了利文斯顿平方误差损失法来计算决策一致性可靠性。选择该方法是因为它可以像其他可靠性方法一样进行解释(如上所述)。它远没有阈值丢失方法那么复杂,并且可以针对所有单一管理表单运行。此统计信息的使用与《教育和心理测试标准》中的标准2.3一致。 20
Prometric建议-项目库比率
下表1中列出了Prometric的内部标准和针对项目库的客户建议。
推荐等级 |
范围 |
---|---|
1.最小目标范围 |
每种形式的项目数量的1.5至2倍 |
2.可接受的目标范围 |
每种形式的项目数为2到3倍 |
3.最佳目标范围 |
每种形式的项目数为3至5倍 |