Criterios técnicos para el desarrollo, uso y mantenimiento de instrumentos de evaluación.

Fecha de disposición28 Abril 2017
Fecha de publicación28 Abril 2017
SecciónPRIMERA. Organismos Autonomos

En el documento que usted está visualizando puede haber texto, caracteres u objetos que no se muestren debido a la conversión a formato HTML, por lo que le recomendamos tomar siempre como referencia la imagen digitalizada del DOF.

Al margen un logotipo, que dice: Instituto Nacional para la Evaluación de la Educación.- México. CRITERIOS TÉCNICOS PARA EL DESARROLLO, USO Y MANTENIMIENTO DE INSTRUMENTOS DE EVALUACIÓN

Introducción

El Instituto Nacional para la Evaluación de la Educación (INEE) tiene como tarea principal evaluar la calidad, el desempeño y los resultados del Sistema Educativo Nacional (SEN) en la educación básica y media superior. Para cumplir con ella, debe diseñar y realizar las mediciones de la calidad de los componentes, los procesos y los resultados del SEN, así como expedir los lineamientos a los que se sujetarán las autoridades educativas federales y locales para llevar a cabo las funciones de evaluación que les correspondan. Por esta razón, es preciso que el Instituto cuente con un marco de referencia que permita desarrollar y aplicar instrumentos de evaluación, además de disponer de un referente para valorar la calidad técnica de las evaluaciones que desarrolla o regula. Los presentes Criterios técnicos para el desarrollo, uso y mantenimiento de instrumentos de evaluación son una actualización de los publicados en abril de 2014.

Propósito

El propósito de estos Criterios técnicos es proveer referentes para el desarrollo, uso y valoración de la calidad de los instrumentos de evaluación, de las prácticas evaluativas y de los usos de los resultados de las evaluaciones. Aunque la valoración de la calidad de dichos instrumentos depende en gran medida del juicio de profesionales, los Criterios técnicos son un marco de referencia que asegura que los aspectos más importantes de la evaluación educativa sean considerados. En general, estos Criterios buscan proporcionar información técnica relevante de las evaluaciones, de tal manera que los responsables en el desarrollo de los instrumentos, así como las personas involucradas en la toma de decisiones de política educativa conozcan los alcances y limitaciones de los resultados que arrojan los instrumentos de evaluación educativa en el país, y cuenten con una guía para su adecuada interpretación.

Alcance

Estos Criterios técnicos pretenden ser una guía para el desarrollo de cualquier instrumento de evaluación de diferente orden (pruebas, cuestionarios o encuestas) que se elabore dentro o fuera del Instituto y que en su diseño se midan constructos o variables latentes (tales como rendimiento, conocimientos, habilidades -cognitivas, socioemocionales o afectivas-, autoeficacia, representaciones sociales, actitudes, percepciones, entre otros).

El rigor con el que se apliquen los criterios depende de las características de la evaluación; por ejemplo, la exigencia es distinta si se trata de desarrollar instrumentos para una evaluación de rendimiento en la cual se pone en juego la trayectoria académica o profesional de las personas a aquel proceso de evaluación cuyo fin es realizar un diagnóstico de capacidades académicas en el área de ciencias al inicio de un ciclo escolar.

Términos técnicos

A continuación, se enlista el glosario de términos técnicos empleados en el documento para la correcta comprensión de su contenido.

  1. Accesibilidad: Es el grado en el que las personas con discapacidad son integradas al proceso de evaluación en igualdad de condiciones con las demás.

  2. Adaptaciones al instrumento: En el contexto de la evaluación, representan los ajustes necesarios al instrumento para garantizar que las personas con alguna discapacidad participen en igualdad de condiciones con el resto de los evaluados.

  3. Administración del instrumento: Proceso en el que una o más personas contestan el instrumento de evaluación.

  4. Administrador del instrumento: Persona responsable de llevar a cabo la aplicación de los instrumentos de evaluación conforme a los protocolos establecidos.

  5. Alto impacto: Se entiende que una evaluación es de alto impacto cuando sus resultados tienen consecuencias importantes para las personas o las instituciones; por ejemplo, los procesos de admisión o certificación.

  6. Autoevaluación: Ejercicio de valoración de las características (conocimientos, actitudes, valores, conducta, etcétera) que la persona que contesta el instrumento hace de sí misma.

  7. Banco de reactivos: Repositorio donde se resguardan y clasifican los reactivos que integran los instrumentos de evaluación; en él se administran los datos de identificación del reactivo, sus características métricas, las formas en las que se incorporó y las fechas en las que se utilizó.

  8. Cuestionario: Tipo de instrumento de evaluación que sirve para recolectar información sobre actitudes, conductas, opiniones, contextos demográficos o socioculturales, entre otros.

  9. Constructo: Elaboración teórica formulada para explicar un proceso social, psicológico o educativo.

  10. Deseabilidad social: Se refiere a la tendencia de las personas a dar una imagen más favorable de sí mismas al momento de responder un instrumento de evaluación; lo que ocasiona una distorsión en la medición.

  11. Dominio: Conjunto de conocimientos, habilidades, destrezas, actitudes u otros atributos que tienen las siguientes propiedades: límites, extensión y definición. También se puede aplicar a contenidos, procedimientos u objetos.

  12. Educación básica: Tipo de educación que comprende los niveles de preescolar, primaria y secundaria en todas sus modalidades, incluyendo la educación indígena, la especial y la que se imparte en los centros de educación básica para adultos.

  13. Educación media superior: Tipo de educación que comprende el nivel de bachillerato, los demás niveles equivalentes a éste, así como la educación profesional que no requiere bachillerato o sus equivalentes.

  14. Equiparación: Método estadístico que se utiliza para ajustar las puntuaciones de las formas o versiones de un mismo instrumento, de manera tal que al sustentante le sea indistinto, en términos de la puntuación que se le asigne, responder una forma u otra.

  15. Error de medida: Es la diferencia entre el valor medido y el "valor verdadero". Cuando la medida es más precisa, el error es más pequeño y viceversa.

  16. Error estándar de medida: Es la estimación de mediciones repetidas de una misma persona en un mismo instrumento que tienden a distribuirse alrededor de un puntaje verdadero. El puntaje verdadero siempre es desconocido porque ninguna medida puede ser una representación perfecta de un puntaje verdadero.

  17. Escala: Conjunto de números, puntuaciones o medidas que pueden ser asignados a objetos o sucesos con propiedades específicas a partir de reglas definidas.

  18. Escala de actitud: Conjunto de reactivos que tiene como propósito recolectar información del grado de aceptación o preferencia sobre algún aspecto de interés.

  19. Escalamiento: Proceso a través del cual se construye una escala que facilita la interpretación de los resultados que se obtienen en uno o varios instrumentos de evaluación, colocando las puntuaciones de los distintos instrumentos o formas a una escala común.

  20. Especificaciones de tareas evaluativas o de reactivos: Descripción detallada de las tareas específicas susceptibles de medición, que deben realizar las personas que contestan el instrumento de evaluación. Deben estar alineadas al constructo definido en el marco conceptual.

  21. Estándar: Principio de valor o calidad en la conducción y uso de los procedimientos de evaluación. Constituye el referente para emitir un juicio de valor sobre el mérito del objeto evaluado.

  22. Estructura: Está compuesta por los contenidos o aspectos disciplinares que mide un instrumento, así como el número y porcentaje relativo de reactivos o tareas evaluativas con que se integra el instrumento y su distribución.

  23. Evaluación: Proceso sistemático mediante el cual se recopila y analiza información, cuantitativa o cualitativa, sobre un objeto, sujeto o evento, con el fin de emitir juicios de valor al comparar los resultados con un referente previamente establecido. La información resultante puede ser empleada como insumo para orientar la toma de decisiones.

  24. Formas de un instrumento: Dos o más versiones de un instrumento que se consideran equivalentes, pues se construyen con los mismos contenidos y especificaciones estadísticas.

  25. Funcionamiento diferencial del instrumento (DFT): Se refiere a la tendencia del instrumento a funcionar de manera diferente en diferentes subpoblaciones, a pesar de que los individuos que

    las componen obtengan puntuaciones similares en el instrumento. Las subpoblaciones son definidas por algo distinto a los aspectos relacionados con el constructo evaluado y suelen considerar aspectos de los individuos que las componen, tales como el sexo, la edad, el grupo étnico o el estatus socioeconómico.

  26. Funcionamiento diferencial del reactivo (DIF): Se refiere a la tendencia del reactivo a funcionar de manera diferente en diferentes subpoblaciones, a pesar de que los individuos que las componen obtengan puntuaciones similares en el reactivo.

  27. Índice de generalizabilidad: Este indicador se calcula con el propósito de identificar y estimar la magnitud de las distintas fuentes de variación que pueden intervenir en las diferencias entre puntuaciones o variación debida a las puntuaciones del universo y a las múltiples fuentes de error.

  28. Instrumento de evaluación: Herramienta de recolección de datos que suele tener distintos formatos, atendiendo a la naturaleza de la evaluación, por ejemplo, instrumentos de selección de respuesta, instrumentos de respuesta construida, cuestionarios, observaciones, portafolios, entre otros.

  29. Jueceo: Método en el cual se utiliza la opinión de expertos (denominados jueces) para valorar y calificar distintos aspectos, tales como las respuestas y ejecuciones de las personas que participan en una evaluación o la calidad de los...

Para continuar leyendo

Solicita tu prueba

VLEX utiliza cookies de inicio de sesión para aportarte una mejor experiencia de navegación. Si haces click en 'Aceptar' o continúas navegando por esta web consideramos que aceptas nuestra política de cookies. ACEPTAR