이 문서는 Prometric 내부 심리학자가 추가 검토를 위해 내부 항목을 평가하고 표시하는 일반적인 지침을 설명합니다. 이 지침은 고전적인 테스트 이론을 활용하는 프로그램에 적용됩니다.
양식 조립 및 통계 검토의 요소 |
사양 / 표준 |
---|---|
1. 아이템 난이도 |
P- 값 = .30-.89 (최적) * |
2. 품목 차별 지수에 대한 목표 가치 |
rpBis> .20 |
3. 내부 일관성 신뢰성 추정을위한 목표 범위 |
알파> .80 |
4. 분류 일관성 또는 신뢰성 추정을위한 목표 범위 | 리빙스턴> .80 |
허용 범위가 최적 범위보다 크고 아래에 설명되어 있습니다. |
의도 된 아이템 난이도
P- 값 = 0.30 ~ 0.89 |
---|
Prometric 직원은 개별 p- 값이 절대적이고 반복 가능한 값을 나타내거나 구체적인 해석을 보증하지 않음을 인식하도록 훈련되었습니다. 오히려 Prometric 심리학자는 추세를 평가하는 데 사용할 수있는 모든 항목 분석 정보를 검토합니다. 참고 : p- 값만으로는 대부분의 항목 해석에 충분하지 않습니다. 모든 기본 품목 검토는 품목 처분 결정을 내리기 전에 p- 값과 rpBis를 통합합니다.
p- 값 (어려워하기 쉽다) | 품목 해석 |
---|---|
1.00에서 0.96 |
SME에서 제거 또는 개정을 위해 플래그를 지정해야하는 측정 값이 최소 인 허용되지 않는 품목. |
0.90에서 0.95 |
매우 쉬운 (허용되지 않는) 항목 : 적절한 차별을 위해 rpBis를 검토하십시오. SME를 검토해야 할 수도 있습니다. |
0.89에서 0.80 |
상당히 쉬운 (허용 가능한) 항목 : rpB가 검토를 통해 차별을 확인합니다. |
0.79에서 0.40 |
단단하고 적당히 쉬운 (허용 할 수있는) 품목 : rpBis가 사양 내에있는 경우 사용하십시오. |
0.39에서 0.30 | 어려운 (허용되는) 항목 : rpB가 면밀히 검토되고 rpBis가 사양에 맞는 경우 사용하십시오. |
0.29에서 0.20 | 매우 어려운 (허용되지 않는) 항목 : 적절한 차별을 위해 rpBis를 검토하십시오. 중소기업의 검토가 필요할 수 있습니다. |
0.19에서 0.00 | 허용되지 않는 품목 : 부적절하게 어렵거나 결함이있는 경우. 중소기업에 의해 제거 또는 개정 된 것으로 표시되어야합니다. |
아이템이 한계가있는 것으로 밝혀지면 개발자는 아이템의 rpBis를 봅니다. rpBis가 높으면 해당 항목을 시험에 유지하기 위해 더 많은 허용 오차가 부여됩니다.
품목 식별 지수의 목표 값
rpBis = 0.20 ~ 1.00 |
---|
포인트 Biserial (rpBis)은 Prometric 심리학자가 각 항목의 차별 력을 결정하는 데 사용됩니다. 다른 고전 통계와 마찬가지로 rpBis의 사용은 정확한 과학이 아닙니다. 경우에 따라 낮은 rpBis 값은 특히 높거나 낮은 p- 값, 신뢰할 수없는 산만으로 인한 낮은 항목 분산, 후보자의 동질성으로 인한 낮은 점수 변동 또는 매우 치우친 점수 분포로 인해 발생할 수 있습니다. 따라서 Prometric 심리학자는 항목 분석을 검토 할 때 몇 가지 통계를 고려해야합니다. 표 3은 개발자가 항목 판별을 검토 할 때 사용하는 지침을 요약합니다. 이 가이드 라인은 항목이 올바르게 입력되었고 후보 샘플이 충분히 크다고 가정합니다.
RpBis (강약) |
품목 해석 |
---|---|
1.00에서 0.50 |
매우 강함 (허용됨) |
0.49에서 0.30 |
강력 함 (허용됨) |
0.29에서 0.20 |
허용 가능 (검토가 필요할 수 있음) |
0.19에서 0.10 |
여백 (허용되지 않는 항목) : 텍스트와주의를 집중시킵니다. |
0.09에서 0.00 | 약한 (허용 할 수없는) 항목 : p- 값이 매우 높을 수 있습니다. 중소기업에 의한 제거 또는 개정을위한 플래그. |
-0.01 ~ –0.20 |
허용되지 않는 품목 : 부적절하게 어렵거나 다른 결함. 중소기업에 의해 제거 또는 개정 된 것으로 표시되어야합니다. |
표 4는 다양한 범위의 알파 계수에 대해 심리 측정 팀이 사용한 해석을 나열합니다.
알파 |
내부 일관성 신뢰성 해석 |
---|---|
0.60 미만 |
새로운 형태를 요구하는 허용 할 수없는 계수 |
0.60에서 0.69 |
양식 수정 또는 제거가 필요한 열악한 계수 |
0.70 ~ 0.79 |
양식 검토 / 수정이 필요할 수있는 한계 계수 |
0.80 ~ 0.89 |
좋은 계수 |
0.90 이상 |
우수한 계수 |
합격 / 불합격 결정의 분류 일관성 또는 신뢰성 추정치의 목표 범위
r = 0.80 이상 |
---|
Prometric은 의사 결정 일관성 신뢰성을 계산하기 위해 Livingston의 제곱 오류 손실 방법을 선택했습니다. 이 방법은 다른 신뢰성 측정과 같이 해석 될 수 있기 때문에 선택되었습니다 (위에서 논의). 임계 값 손실 방법보다 훨씬 덜 복잡하며 모든 단일 관리 양식에 대해 실행할 수 있습니다. 이 통계의 사용은 교육 및 심리 테스트 표준, p. 20.
Prometric Recommendations-품목 은행 비율
품목 은행에 대한 Prometric의 내부 표준 및 고객 권장 사항은 아래 표 1에 나와 있습니다.
추천 레벨 |
범위 |
---|---|
1. 최소 목표 범위 |
양식당 항목 수의 1.5 ~ 2 배 |
2. 허용 가능한 목표 범위 |
양식당 항목 수의 2 ~ 3 배 |
3. 최적의 목표 범위 |
양식당 항목 수의 3 ~ 5 배 |