Razões para o pré-teste
Qualquer programa de teste precisa desenvolver processos para incorporar novo conteúdo em seus exames. O pré-teste dos itens antes de usá-los como itens pontuados em um exame ao vivo é realizado por dois motivos principais:
- Avaliação estatística de itens: os itens de pré-teste permitem a coleta de estatísticas sobre o desempenho do candidato em cada novo item. Independentemente da qualidade do processo de desenvolvimento do teste, é possível que itens de qualidade tenham um desempenho inesperado na população candidata. A avaliação das estatísticas do pré-teste permite a confirmação de que os itens recém-desenvolvidos estão executando dentro de parâmetros estatísticos aceitáveis antes do item que afeta a pontuação no exame de um candidato.
- Coletando estatísticas para equiparar: para garantir que todo candidato receba um exame de dificuldade eqüitativa, a pré-equiparação dos formulários de exame é um método de desenvolvimento de teste desejado. A administração de exames de um banco geral para um nível de dificuldade especificado exige que os itens ativos usados no banco de exames tenham estatísticas associadas a eles. Um processo de pré-teste contínuo e padronizado alimenta continuamente um banco de itens e garante que a pré-equação possa ser executada.
A avaliação do item e a pré-equação são projetadas para criar um processo de teste válido que seja justo para todos os candidatos. A combinação desses processos em um plano geral de desenvolvimento garante que cada item ativo apresentado aos candidatos tenha um bom desempenho e que cada candidato receba um exame de dificuldade eqüitativa. Isso cria a base para um programa de teste defensável.
As informações a seguir abordam as principais considerações para qualquer programa que incorpore um processo de pré-teste.
Modo de entrega
Existem diferentes metodologias disponíveis para pré-teste - as duas principais metodologias são (1) formas separadas de pré-teste e (2) pré-teste incorporado a uma forma existente.
Formulários de pré-teste separados
Alguns programas preferem separar completamente o processo de pré-teste da administração do exame ao vivo. Para atingir esse objetivo, é necessário criar exames pré-teste separados que possam ser administrados à população candidata. Os exames pré-teste completos são criados com a mesma proporção de itens presentes no formulário do exame ao vivo. Formulários separados de pré-teste são normalmente administrados a candidatos voluntários durante administrações especiais de pré-teste. Os candidatos voluntários devem representar o mais próximo possível o mesmo tipo de pool de candidatos que normalmente faria o exame ao vivo.
Os benefícios dessa abordagem são que a experiência de teste ao vivo não é afetada de forma alguma. Os candidatos que participam das sessões de pré-teste o fazem voluntariamente e com plena consciência do processo. As desvantagens dessa abordagem incluem (1) um período estendido de coleta de dados e (2) uma possível inclinação do pool de candidatos e dos dados subsequentes do pré-teste. Quando um processo de pré-teste depende de voluntários, geralmente leva um longo período de tempo para reunir uma amostra grande e suficiente de candidatos para permitir a análise dos dados do pré-teste. Além disso, um processo que depende de candidatos voluntários altera inerentemente a composição do pool de candidatos. Como geralmente são os candidatos motivados e de alto desempenho que se voluntariam para fazer um exame de pré-teste, o pool de candidatos não é mais representativo de toda a gama de indivíduos que fazem um exame ao vivo. Essa alteração potencial do pool de candidatos com desempenho predominantemente alto pode distorcer os dados de pré-teste resultantes.
Itens de pré-teste incorporados no formulário existente
Uma segunda metodologia de pré-teste envolve a inclusão de uma pequena porcentagem de itens de pré-teste nos formulários de exame existentes. Essa metodologia permite o pré-teste gradual dos itens durante as administrações regulares dos exames. Um benefício dessa abordagem é que os candidatos que respondem aos itens do pré-teste são os mesmos candidatos que fazem o exame ao vivo - o que elimina amplamente o potencial de contaminação do pool de candidatos. Como esse processo não envolve o uso de voluntários, também permite a coleta de dados de pré-teste da maneira mais eficiente, reduzindo os atrasos na coleta de dados devido ao longo tempo de recrutamento de voluntários.
As desvantagens dessa abordagem envolvem a extensão do número de itens no exame. Aumentar o número de itens em um exame pode aumentar a ansiedade e a fadiga do candidato em responder às perguntas do exame. Secundariamente, um número menor de itens de pré-teste é testado em formulários existentes do que em formulários separados de pré-teste. Portanto, um protocolo deve ser estabelecido para alternar os itens de pré-teste em um prazo razoável.
Divulgação de Candidatos
A maioria dos profissionais de desenvolvimento de testes recomendaria que o processo de pré-teste fosse divulgado aos candidatos antes da administração do exame. Existem opções, no entanto, a respeito de quanta informação é divulgada à população candidata.
- Conhecimento do número de itens de pré-teste: Normalmente, os candidatos são informados antes do exame quantos itens de pré-teste serão exibidos no exame. Os candidatos também são informados de que os itens do pré-teste não afetarão sua pontuação geral.
- Conhecimento exato dos itens pré-teste: Normalmente, os candidatos não são informados exatamente quais são os itens pré-teste. Isso é feito para garantir que os candidatos respondam aos itens do pré-teste da mesma maneira que respondem aos itens do exame ao vivo (com um desejo equitativo de responder o item corretamente).
Método de Apresentação
Se itens de pré-teste são incorporados a um formulário existente, existem várias maneiras de apresentar os itens de pré-teste. Três metodologias são descritas abaixo.
- Início do exame: Todos os itens do pré-teste podem ser apresentados em uma seção no início do exame.
- Fim do exame: todos os itens do pré-teste podem ser apresentados em uma seção no final do exame.
- Distribuído durante o exame: os itens podem ser distribuídos nas seções de conteúdo apropriadas do exame.
Para garantir que os candidatos respondam aos itens do pré-teste como se fossem um item ativo no exame, a Prometric recomenda que os itens do pré-teste sejam distribuídos por todo o formulário do exame. Isso ajuda a garantir que os candidatos não adivinhem a seção de pré-teste e, portanto, modifiquem seu desempenho nesses itens.
Porcentagem de itens de pré-teste em um formulário existente
Normalmente, é recomendável que os itens do pré-teste não ultrapassem 10% do total de itens no exame (por exemplo, um exame de 40 itens não deve conter mais do que 4 itens). Limitar o número de itens de pré-teste reduz a possibilidade de fadiga do candidato e normalmente elimina a necessidade de estender o tempo de teste.
Número de exposições de candidatos antes da análise
Para a teoria clássica dos testes, a Prometric recomenda um mínimo de 100 exposições de candidatos por item de pré-teste para avaliar a viabilidade estatística. Exposições adicionais do candidato (acima do mínimo de 100) aumentam a estabilidade dos dados do candidato e aumentam a generalização dos resultados do pré-teste.
Parâmetros ideais para a transição do pré-teste para o item ativo
A seção a seguir descreve as diretrizes gerais pelas quais os psicométricos internos da Prometric avaliam itens de pré-teste. Embora os programas individuais possam diferir, essas diretrizes são úteis para fins de avaliação geral. Observe que essas diretrizes se aplicam apenas aos programas que utilizam a teoria clássica dos testes.
Tabela 1: Resumo das especificações estatísticas
Elementos da montagem do formulário e revisão estatística | Especificações / Padrões |
1. Gama de dificuldades do item | Valores-p = 0,30 -,89 (ideal) * |
2. Valores-alvo para índices de discriminação de itens | rpBis> .20 |
3. Intervalos alvo para estimativas de confiabilidade da consistência interna | Alfa> .80 |
4. Intervalos alvo para estimativas de consistência ou confiabilidade da classificação | Livingston> .80 |
Intervalos aceitáveis são maiores que os ideais e são explicados abaixo
Faixa pretendida de dificuldades de itens
Valor P = 0,30 a 0,89
A equipe da Prometric é treinada para reconhecer que os valores de p individuais não representam um valor absoluto e repetível, nem justificam uma interpretação concreta. Em vez disso, os psicométricos da Prometric revisam todas as informações de análise de itens disponíveis para avaliar tendências. Nota: somente os valores de p são insuficientes para a maioria das interpretações de itens. Todas as revisões básicas de itens incorporam valores-p e rpBis antes de tomar decisões de disposição de itens.
Tabela 2: Diretrizes de valor-p
Valor p (fácil a difícil) | Interpretação do item |
1,00 a 0,96 | Itens inaceitáveis com valor mínimo de medição que devem ser sinalizados para remoção ou revisão pelas PME |
0,90 a 0,95 | Itens muito fáceis (possivelmente inaceitáveis): revise rpBis para verificar se há discriminação adequada. Pode precisar rever minhas PME. |
0,89 a 0,80 | Itens razoavelmente fáceis (aceitáveis): revise o rpBis para confirmar a discriminação. |
0,79 a 0,40 | Itens difíceis a moderadamente fáceis (aceitáveis): use se o rpBis estiver dentro das especificações. |
0,39 a 0,30 | Itens difíceis (aceitáveis): revise o rpBis de perto, use se o rpBis estiver dentro das especificações. |
0,29 a 0,20 | Itens muito difíceis (possivelmente inaceitáveis): rpBis reveja a discriminação adequada. Pode precisar de revisão pelas PME. |
0,19 a 0,00 | Itens inaceitáveis: inapropriadamente difíceis ou com falhas. Deve ser sinalizado para remoção ou revisão pelas PME. |
Quando um item é considerado marginal, os desenvolvedores analisam os rpBis do item. Se o rpBis for alto, será dada mais tolerância para manter esse item no exame.
Valores-alvo para índices de discriminação de itens
rpBis = 0,20 a 1,00
Tabela 3: Diretrizes rpBis
RpBis (forte a fraco) | Interpretação do item |
1,00 a 0,50 | Muito forte (aceitável) |
0,49 a 0,30 | Forte (Aceitável) |
0,29 a 0,20 | Aceitável (mas pode precisar de revisão) |
0,19 a 0,10 | Itens marginais (possivelmente inaceitáveis): revise o texto e os distratores. |
0,09 a 0,00 | Itens fracos (inaceitáveis): os valores de p provavelmente são muito altos. Sinalizador para remoção ou revisão por PME. |
-0,01 a -0,20 | Itens inaceitáveis: inadequadamente difíceis ou com falhas. Deve ser sinalizado para remoção ou revisão pelas PME. |
Após a avaliação das estatísticas no nível do item, são tomadas decisões em cada item individual. Os itens podem ser (1) aceitos como estão e colocados na piscina de exames ao vivo, (2) aceitos com modificações e reinseridos na piscina de pré-teste ou (3) rejeitados para uso posterior.
Retornar à página Eficiência de teste e Defensibilidade legal