lunes, 6 de julio de 2009

Sistema de Calificación de Exámenes Empleando Procesamiento Digital de Imágenes

Sistema de Calificación de Exámenes Empleando Procesamiento Digital de Imágenes

Dúber Pérez[1]
Universidad Privada Antenor Orrego, Escuela de Ingeniería Electrónica,
Av. América Sur 3145 Monserrate, Apartado Postal 1075 Trujillo-Perú
dperezp@upao.edu.pe, duberpp@yahoo.es

Resumen

Este trabajo de investigación ilustra la aplicación de técnicas de procesamiento digital de imágenes para implementar un sistema de calificación de exámenes. Se detalla las etapas del sistema así como la función de cada una de ellas. Se pone mayor énfasis en la aplicación de la correlación para el reconocimiento y detección de patrones.

Palabras Clave: Procesamiento digital de Imágenes, correlación, reconocimiento y detección de patrones, sistema de calificación de exámenes.

Abstract

This investigation work shows a new technique in a test grade system implementation using digital image processing. We show each system stage and explain its functions. A stronger detail it is putted on correlation applications as patterns detection and recognition.

Key works: Digital image processing, correlation, patterns detection and recognition, test grade system.

1. Introducción

El sistema de evaluación en nuestras universidades evoluciona lentamente, de este modo las evaluaciones de mayor importancia son con lápiz y papel y pasará algunos años para trasladar este sistema a la computadora. Las evaluaciones en las carreras de ciencias e ingeniería presentan una problemática seria en el sentido de que no se ha trazado de manera clara y concisa un mecanismo de evaluación.

El sistema de evaluación tipo IBM, permite evaluar de manera clara y objetiva los conocimientos del alumno, sin embargo existe cierta resistencia por parte de los docentes a migrar a este tipo de evaluación. A pesar de esta resistencia los exámenes IBM son un sistema de evaluación óptimo. Las evaluaciones IBM evitan que el proceso de calificación sea subjetivo. Así permite reflejar de manera más justa los conocimientos del alumno. Todo tipo de conocimientos pueden ser evaluados mediante una prueba IBM, sin embargo muchas veces la preparación del examen requiere de un diseño bien estructurado por parte del docente.

Los exámenes IBM son la opción más óptima para la homogenización del sistema de evaluación universitario, por lo que debe de considerarse su implementación. Sin embargo el mecanismo de corrección de este tipo de exámenes es una tarea monótona y repetitiva, adicionalmente el docente no percibe remuneración extra por realizarla.

En este sentido el presente trabajo de investigación presenta un sistema de calificación de exámenes empleando técnicas de procesamiento digital de imágenes. El cual permitirá al docente corregir de forma automática sus exámenes de tipo IBM.

2. Antecedentes

Este sistema surge a partir de la problemática que engloba la corrección de exámenes en el entorno universitario. A diferencia de los sistemas de calificación automática implementados en hardware, este sistema está implementado en su totalidad en software y requiere un mínimo de hardware para su funcionamiento gracias al empleo de técnicas de procesamiento digital de imágenes.

Si bien el sistema que presentamos puede competir con los sistemas ópticos tradicionales, no ha sido concebido con esa idea. Este sistema se ha concebido para su uso en pequeña y mediana escala orientándolo a los propios docentes para la calificación de sus evaluaciones cotidianas.

3. Justificación

El proyecto se justifica en el sentido que soluciona una problemática real y lo hace de manera sencilla y económica.

Está problemática tiene un carácter de índole social en el sentido que los exámenes tradicionales tienden a ser subjetivos y están basados en la propia manera de pensar del docente. Las carreras de ciencias e ingeniería, en donde los exámenes son generalmente de cálculo, también están dentro de esta problemática. En este caso los docentes pueden calificar sólo la respuesta correcta o adicionalmente el procedimiento. Si se califica sólo la respuesta correcta el alumno está en desventaja y si se califica el procedimiento la asignación de puntuación será subjetiva. Estas deficiencias en el sistema de evaluación universitario son las que pretende solucionar el sistema de evaluación que presentamos.

Además de la problemática social, discutida anteriormente, existe una problemática operativa. Como se ha comentado en la introducción, el proceso de corrección de exámenes es tedioso, repetitivo y no se percibe remuneración por realizarlo. Esto a veces genera como consecuencia que el docente tome un examen con un número escaso de preguntas y de complejidad elevada, con el fin de simplificar el proceso de calificación. El sistema que presentamos soluciona esta problemática gracias a que automatiza el proceso de calificación y lo convierte en una tarea sencilla y de corta duración.

Además de solucionar una problemática real, este sistema incorpora nuevas ventajas con respecto al método tradicional como es la entrega oportuna de resultados y un mecanismo de calificación flexible.

4. Objetivos

El objetivo principal de este sistema es facilitar al docente una herramienta sencilla y económica que le permita calificar sus evaluaciones de manera objetiva, con un mínimo de intervención humana y en el menor tiempo posible.

Entre otros objetivos trazados tenemos los siguientes. Beneficiar al alumno con un sistema de calificación objetivo el cual le permita conocer sus resultados de manera rápida y veraz. Implementar un sistema flexible que permita elaborar distintos tipos de preguntas con distinta puntuación.

5. Marco Teórico

La correlación es la función más empleada en nuestro sistema por lo que la describiremos en detalle con el fin de entender su función y aplicación.


Figura 1 Señales aleatorias x,y


Figura 2 Correlación de las señales aleatorias x,y

La correlación es una operación que nos permite calcular el grado de similitud de dos funciones. La Figura 1 muestra dos funciones. Se desea saber que tan parecidas son estas funciones. Para esto calculamos su correlación la cual se muestra en la Figura 2.

Al analizar la gráfica de la Figura 2 podemos observar que se obtiene un valor máximo de correlación para -100, esto significa que las señales x e y presentan un alto grado de similitud si desplazamos la señal y 100 unidades hacia la izquierda.

La correlación discreta entre dos señales se define como


La convolución discreta se define como


Por lo tanto podemos implementar la correlación usando la convolución mediante la siguiente operación


La ventaja de implementar la correlación como la convolución radica en que la convolución la podemos implementar como un filtro, de modo que podemos explotar las técnicas de implementación de filtros para implementar la correlación de manera eficiente [1].

6. Metodología

6.1 Descripción General del sistema

El sistema se ha diseñado de modo que se requiera un mínimo de hardware. En este sentido el docente sólo necesita de una PC, impresora y scanner. Estos equipos se encuentran con facilidad en el mercado y son de precios accesibles.

Los exámenes están compuestos de dos partes. La primera parte contiene las preguntas que el alumno debe de responder, esta parte no es necesaria que el alumno la entregue al momento de finalizar su examen. La segunda parte es su cartilla de evaluación donde los alumnos marcan sus respuestas, esta cartilla debe ser entregada obligatoriamente al momento de finalizar el examen. Después de recoger las cartillas de los alumnos, el docente procede a escanear los exámenes y a procesarlos en el sistema de calificación para obtener automáticamente los resultados.

6.2 Creación de Exámenes

Los exámenes se componen de preguntas y estas a su vez están agrupadas en secciones. A continuación se detallan las características de cada una de ellas.

Preguntas

Las preguntas pueden ser de dos tipos. Las preguntas que tienen una sola alternativa correcta y las preguntas que tienen una o más alternativas correctas. Las preguntas con una alternativa correcta se califican como buenas si se marca la alternativa correcta, si se marca otra alternativa se califica como mala y finalmente, en caso que no se marque ninguna alternativa se la calificará como sin marcar. En el caso de las preguntas con más de una respuesta correcta, se califica por alternativa, es decir, se evalúa si cada alternativa es correcta o incorrecta. En el caso que toda la pregunta se haya dejado en blanco se calificará como sin marcar.

Ejemplo 1: Pregunta con una alternativa correcta

¿Quién es el padre de Bar Simpson?(5,-2)

a. Homero Simpson (A)(C)

b. Ned Flanders

c. Buzz Lightyear

d. Papá Pitufo

e. Padre Alberto Cutié

Para este ejemplo asumiremos que la pregunta correcta vale 5 puntos, la pregunta incorrecta vale -2 puntos y la pregunta sin marcar vale 0 puntos. Las alternativas con una (A) indican que fueron marcadas por el alumno. Las alternativas marcadas con una (C) indican la respuesta correcta.

En este caso el alumno a marcado la alternativa (a) que es a su vez la respuesta correcta. La calificación de la respuesta será de 5 puntos. En caso que el alumno marque cualquier otra alternativa distinta de (a), su puntuación será de -2. Si, de otro modo no se selecciona ninguna alternativa la pregunta tendrá una calificación de 0 puntos. Adicionalmente, se puede dar el caso que el alumno marque la alternativa a. y adicionalmente otra alternativa, en este caso su respuesta se califica como incorrecta y se le asigna un valor de -2 puntos.

Ejemplo2: Pregunta con más de una alternativa correcta

¿Quiénes son los hijos de March y Homero Simpson? (5,-2)

a. Bart (A)(C)(1)

b. Milhouse (A)(-0.4)

c. Lisa (C)(-0.4)

d. Ralph (1)

e. Nelson (1)

Para este ejemplo asumiremos que la pregunta bien contestada vale 5 puntos, mal contestada -2 y sin responder 0 puntos.

El alumno marca las alternativas (a) y (b), sin embargo las alternativas correctas son (a) y (c). En este caso cada alternativa bien contestada tendrá un puntaje de 1 y cada alternativa mal contestada tendrá un puntaje de -0.4. El alumno ha acertado en tres alternativas, a, d y e, por lo que tiene 3 puntos, pero ha fallado en dos, b y c, lo que hace -0.8 puntos. Finalmente la calificación de la pregunta será de 3-0.8, es decir, 2.2 puntos.

Tabla 1 Ejemplo de puntuación de secciones

Sección

Preguntas

Puntaje +

Punaje -

Tipo

Sección 1

8

+8

-6

Una o más

Sección 2

6

+6

-4

Sólo una

Sección 3

7

+6

-3

Sólo una

Secciones

Las preguntas de un mismo tipo se agrupan en secciones, un examen puede estar compuesto de un número infinito de secciones, en teoría. A cada sección se le asigna dos tipos de puntaje. Un puntaje positivo y un puntaje negativo. La suma del puntaje positivo de todas las secciones debe de dar 20 puntos. La sección tendrá un puntaje igual al puntaje positivo en caso que todas las preguntas se respondan correctamente. Adicionalmente al puntaje positivo, a cada sección se le asigna un puntaje negativo, el puntaje negativo es el valor que se le asigna a la sección en el caso que todas sus preguntas se respondan de manera incorrecta. Su valor se deja al criterio del docente con la recomendación de no asignar un puntaje mayor al valor del puntaje positivo de la sección. La Tabla 1 muestra un ejemplo de asignación de puntuación a las secciones de un examen.

6.3 Algoritmo de procesamiento

El procesamiento de la imagen atraviesa los pasos de acondicionamiento, rotación, ubicación, revisión y calificación. Este proceso debe de realizarse por cada examen, previamente se debe de cargar la clave del examen para que se la pueda comparar con los resultados del alumno. La Figura 3 muestra el diagrama de flujo de todo el proceso. A continuación explicaremos brevemente la función que realizan cada una de estas etapas.


Figura 3 Diagrama de bloques del algoritmo de procesamiento

Acondicionamiento

Su función es cargar la imagen en formato .jpg y convertirla a una imagen binaria. Para esto en primer lugar se convierte la imagen de colores de tipo RGB a una imagen en escala de grises. Luego se convierte la imagen en escala de grises a una imagen binaría. Para realizar esta conversión se debe de especificar el umbral a partir del cual se considera un tono de gris como negro. La Figura 4 muestra la conversión de una imagen en escala de grises a una imagen binaria para distintos valores del umbral de conversión [2].


Figura 4 Imagen en escala de grises e imágenes binarias


a. Rotación horaria b. Rotación anti horaria

Figura 5 Cálculo del ángulo de rotación

Rotación

Al momento de escanean los exámenes, puede existir una ligera rotación, por lo que es necesario corregir esta rotación. Para solucionar los problemas de rotación se han colocado tres marcas de calibración en la cartilla de evaluación. Estas marcas permiten detectar el ángulo y dirección en que se debe de rotar el examen. La Figura 5 muestra como se calcula estos ángulos tanto para una rotación en sentido horario como anti horario [3][4].

Ubicación

Esta operación consiste en recortar la información del código de alumno y sus respuestas, de modo que se aísle esta información del contenido adicional con el fin de acelerar el procesamiento de la información. La posición y tamaño del código y de las respuestas se calcula de manera indirecta con la información adquirida en el proceso de rotación. De este modo se hace el proceso independiente de la marca y tipo de impresora y de la resolución del scanner. La Figura 6 muestra el recorte del área de código del alumno.


Figura 6 Recorte de la sección código de alumno


Figura 7 Revisión de la una pregunta emplea la correlación

Este método soluciona la peculiaridad en donde cada impresora aplica su propia escala de impresión de modo que la ubicación y tamaño del área de código de alumno no será igual en una cartilla impresa con una impresora laser que con una impresora de inyección a tinta. Sin embargo la proporción de las dimensiones se mantendrá de una impresora. Estas proporcionas se mantienen constantes y son empleadas por este etapa para calcular la posición y tamaño del área de código de alumno y sus respuestas [5].

Revisión

Es la etapa más importante, consiste en determinar el código del alumno así como sus respuestas. Esta información se enviará a la siguiente etapa para determinar los resultados.

Para determinar las alternativas que marca el alumno se emplea la correlación. Los índices más altos de correlación indicarán si se ha seleccionado una alternativa. Este proceso se muestra en la Figura 7 para el área de respuestas. Se puede observar que sólo la segunda línea vertical sobrepasa la línea horizontal, esto significa que para esta respuesta el alumno sólo ha marcado la alternativa (b).

Calificación

Finalmente se pasará la información de código del alumno y sus respuestas a esta etapa que se encarga de comparar estos resultados con la clave del examen y otorgarle una calificación de acuerdo a sus respuestas.

Tabla 2 Resultados

Parámetro

Valor

Número de secciones

6

Número de alumnos

157

Número de correcciones en el sistema

3

Errores al completar el campo código

14

Tiempo promedio en corregir el examen de una sección

9 minutos

Tiempo promedio en corregir el examen de un alumno

24 segundos

6.4 Resultados

Hasta el momento el sistema de calificación se ha aplicado en seis exámenes y a un total de 157 alumnos. Los resultados obtenidos se muestran en la Tabla 2.

En el transcurso de la etapa de prueba se ha realizado tres correcciones al sistema. La primera, en la etapa de acondicionamiento en donde se modificó la técnica para calcular el nivel de saturación necesario al convertir la imagen de escala de grises a binario, esta modificación se realizó debido a que en algunas situaciones los alumnos realizaban correcciones a sus respuestas en donde las respuestas erradas quedaban levemente sombreadas de acuerdo a la calidad del borrador empleado, estas respuestas el sistema las consideraba como marcadas en lugar de descartarlas.

La segunda modificación se realizó en la etapa de rotación, haciéndola más robusta. Finalmente la tercera modificación se realizó en la etapa de ubicación, en donde se modificó la manera en que se calculaba las dimensiones de los campos código y respuestas, los cuales eran susceptibles al tipo de impresora empleada.

Los tiempos de procesamiento obtenidos también son alentadores, el docente podrá obtener los resultados de sus exámenes en menos de diez minutos. De este modo se beneficia en el sentido que puede invertir su tiempo en tareas más trascendentes y útiles.

7. Conclusiones y Futuras Mejoras

El sistema desarrollado permite automatizar la labor de calificación de exámenes y permite al docente evaluar los conocimientos de los alumnos de una forma objetiva, eficaz y sencilla. El alumno también se beneficia en el sentido que podrá saber el resultado de sus exámenes en un tiempo muy corto.

Si bien el sistema funciona correctamente, su código está escrito en Matlab® por lo que su aplicación de manera general todavía es limitada. De este modo una futura mejora sería el desarrollo de una aplicación para Windows® o una aplicación Web.

La etapa de acondicionamiento podría agregar el procesamiento de la imagen en escala de grises a través de un filtro espacial el cual permita detectar la intensidad con que el alumno haya marcado sus respuestas y seleccionar un parámetro adecuado de conversión de escala de grises a binario.

8. Referencias

[1] John G. Proakis and Dimitris G. Manolakis, Digital Signal Processing Principles, Algorithms and Applications. Upper Saddle River, NJ: Prentice Hall, 1996.

[2] Rafael C. Gonzales, Richard E. Woods and Steven L. Eddins, Digital image Processing Using Matlab®. Upper Saddle River, NJ: Prentice Hall, 2004.

[3] Al Bovik, Handbook of Image and Video Processing. San Diego, California: Academic Press, 2000.

[4] William K, Pratt. Digital Image Processing. Hoboken, New Jersey: John Wiley and Sons, 2007.

[5] Bernd Jähne, Digital Image Processing. Heidelberg, Germany: Springer, 2002.


[1] Ingeniero Electrónico. Especialista en Comunicaciones Móviles, Teleinformática y Procesamiento Digital de Señales. Docente de la Escuela de Ingeniería Electrónica. Universidad Privada Antenor Orrego.



3 comentarios: