Aplicación de Redes Neuronales Artificiales en la Orientación Vocacional

Nelson Marcelo Romero Aquino
Dirección de Investigación
Facultad Politécnica - UNE Ciudad del Este, Paraguay
[email protected]

Eustaquio Alcides Martínez Jara
Dirección de Investigación
Facultad Politécnica - UNE Ciudad del Este, Paraguay
[email protected]

Resumen-Este trabajo propone un sistema con capacidad de generar recomendaciones vocacionales, implementando técnicas de inteligencia artificial. El objetivo es proporcionar una alternativa de solución al problema de selección de profesión de los jóvenes al finalizar sus estudios secundarios. Para validar la propuesta, un grupo de individuos compuesto por alumnos de dos colegios secundarios de la región fueron sometidos a pruebas de orientación vocacional a través de un sitio web diseñado y construido para el efecto. Enseguida, con la ayuda de un profesional se determinaron las áreas vocacionales recomendadas para cada sujeto. Los resultados de los tests, así como las recomendaciones profesionales fueron utilizados como datos de ejemplo para someter al sistema a un proceso de aprendizaje con lo que la herramienta propuesta, logró proporcionar recomendaciones coherentes y de forma autónoma.

Palabras claves: Redes neuronales artificiales; Inteligencia artificial; Selección de personas; Orientación vocacional

INTRODUCCIÓN

Para seleccionar una carrera profesional durante los últimos años de la etapa escolar, las pruebas de orientación vocacional se constituyen en herramientas útiles y muy utilizadas por los estudiantes. Los resultados de estas pruebas proporcionan datos que relacionan a una persona con distintas áreas y indican el nivel de pertenencia a las mismas. Si bien la mayoría de las pruebas vocacionales proporcionan resultados fácilmente interpretables por cualquier individuo [1], sin embargo existen otras cuya interpretación es posible únicamente con la asistencia de un profesional o a través de un exhaustivo análisis y estudio de los distintos aspectos que enumera el test y la relación de dichos aspectos con las diversas profesiones que un individuo tiene como opción [2]. Esto constituye un problema no menor, debido a que en ocasiones, no es posible contar con la asistencia de un especialista.

Las Redes Neuronales Artificiales (RNAs) son un paradigma de aprendizaje y procesamiento automático, basado en el funcionamiento del sistema nervioso de los seres vivos, y cuyo objetivo es el procesamiento de información para la resolución de problemas [3]. La principal característica de las RNAs es su capacidad para construir un sistema capaz de resolver problemas de clasificación y predicción de patrones a través de un proceso de aprendizaje en el que la RNA recibe datos de ejemplo (soluciones) para el problema que se pretende modelar, y que se han obtenido previamente. No son necesarios algoritmos o modelos definidos previamente, para que una Red Neuronal encuentre la solución a un problema en particular, sólo son necesarios los datos de ejemplo.

Teniendo en cuenta la mencionada característica, la propuesta plantea la implementación de una Red Neuronal Artificial capaz de recomendar áreas vocacionales en base a las informaciones obtenidas en pruebas de orientación vocacional, teniendo como principal objetivo proponer una alternativa de solución al problemática consistente en que el joven, que finaliza sus estudios secundarios, no cuenta con la posibilidad de interpretar los resultados obtenidos en pruebas vocacionales, o tras combinar los resultados de dos o más pruebas.

Se propone resolver el problema utilizando Redes Neuronales debido a que el problema de recomendación de áreas vocacionales no puede ser programado tradicionalmente (al tratarse las recomendaciones de un conjunto de opiniones subjetivas que naturalmente no comprenden un modelo identificable) sino que sólo se cuenta con datos de ejemplos (las recomendaciones vocacionales para un cierto conjunto de resultados de un individuo en un test vocacional) que el sistema debe ser capaz de comprender y emular [3].

A. OrientaciÓn vocacional

La orientación vocacional está asociada al área de la selección de personal y existen trabajos que han buscado resolver problemas de dicha índole mediante la implementación de RNAs. A continuación se exponen algunos.

-Selección de personal mediante redes neuronales artificiales [4].
-Análisis de rendimiento académico estudiantil usando data warehouse y redes neuronales [5].
-Predicción del rendimiento de los estudiantes y diagnóstico usando redes neuronales [6].
-Redes neuronales artificiales para la asistencia de diagnósticos psiquiátricos [7].

B. HipÓtesis

Es posible construir un sistema capaz de reproducir con exactitud el proceso por el cual un profesional del área de la psicología utiliza sus conocimientos y experiencias para analizar los resultados obtenidos por un individuo en una o varias pruebas vocacionales y posteriormente otorgar una recomendación vocacional.

II. MATERIALES Y MÉTODOS

Para el desarrollo del trabajo se utilizaron dos pruebas vocacionales: el Inventario de Intereses de Hereford y el Test de Aptitudes Diferenciales (DAT).

El primero es un cuestionario de 90 preguntas que son respondidas numéricamente seleccionando un número del 1 al 5. Cada pregunta forma parte de una determinada área de interés, por ejemplo “tocar un instrumento musical” forma parte del área Musical, mientras que “Leer a los clásicos” es una pregunta referente al área de Literatura.

El segundo está constituido por 8 formularios que contienen distintos tipos de ejercicios, cuya cantidad varía en cada caso. El resultado de cada formulario del test DAT proporciona una estimación numérica que representa la capacidad o aptitud del individuo para desempeñarse en un área determinada.

A diferencia del inventario de intereses de Hereford, en el que no hay resultados incorrectos sino que únicamente estimaciones de grados de interés, las respuestas a los ejercicios de los formularios del test DAT pueden estar correctas o incorrectas [2]. Ambos test se pusieron a disposición en un sitio web programado en HTML [8] y PHP [9].

Un total de 78 alumnos del nivel medio del Colegio Sembrador y del Centro Regional de Educación Dr. José Gaspar Rodríguez de Francia, ambas instituciones de Ciudad de Ciudad del Este, Paraguay, completaron ambas pruebas vocacionales accediendo al mencionado sitio.

Una vez reunidas todas las muestras, consistentes en los resultados de los alumnos en las dos pruebas vocacionales, se realizaron las recomendaciones vocacionales y, posteriormente, la red neuronal artificial fue implementada.

La estructura de datos establecida para el tratamiento de los mismos, tanto para efectuar la recomendación como para implementar la red neuronal ha sido la siguiente:

-Datos de entrada: resultados de las pruebas vocacionales, que comprenden 17 ítems (9 resultados de la prueba Hereford y 8 resultados del test DAT) normalizados, valores numéricos comprendidos entre 0 y 1.
-Datos de salida: recomendaciones vocacionales compuesto por cuatro ítems binarios, que pueden tomar valores 0 o 1. Cada ítem representa un área vocacional (Física/Matemática, Químico/Biológica, Ciencias Sociales, Humanidades/Artes). El valor de salida del ítem determina si el área vocacional al que éste hace referencia es recomendada (valor 1) o no (valor 0).

Figura 1. El primer diseño de la RNA.

Los datos de entrada se han diseñado de dos formas. La RNA se ha implementado utilizando ambas estructuras. En la primera se utilizaron como datos de entrada los resultados obtenidos por los sujetos en las dos pruebas vocacionales: el inventario de intereses de Hereford, y el test DAT.

La segunda estructura se ha basado únicamente en la utilización de los resultados de una de las pruebas, los del test DAT. La primera estructura puede ser vista en la Figura 1.

Figura 2. El segundo diseño de la RNA.

La estructura, en la que se utilizan sólo los resultados del test DAT como variables de entrada, se puede ver en la Figura 2. En ambos casos la cantidad de neuronas de salida permanece inalterable.

Una vez que se han hecho todas las recomendaciones correspondientes para cada sujeto, se ha dividido las muestras en dos grupos: 60 % para el entrenamiento de la red y 40 % para la prueba.

El modelo de RNA utilizado ha sido el Perceptrón Multicapa [10] (MLP o Multilayer Perceptron), un tipo de red neuronal que incorpora más de una capa de unidades de procesamiento; fue introducido para poder resolver problemas que no son linealmente separables. La arquitectura típica de un MLP se puede visualizar en la Figura 3.

Figura 3. Arquitectura de un MLP.

El algoritmo de aprendizaje, que actualiza los pesos sinápticos de la red, es el de Levenberg-Marquardt [11], que es una modificación del método de Newton. Fue diseñado para acercarse a la velocidad del entrenamiento de segundo orden sin tener que calcular la matriz Hessiana y tiene un excelente desempeño en el entrenamiento de redes neuronales en las que el rendimiento esté determinado por el error cuadrático.

Cuando la función de error tiene la forma de una suma de cuadrados, la matriz Hessiana de la función de suma del cuadrado de los errores y la pendiente, pueden aproximarse, respectivamente, de la siguiente forma:

H = J t J (1)

g = J t .e (2)

En donde J es una matriz Jacobiana que contiene las primeras derivadas de los errores de la red con respecto a los pesos, y e es el vector que contiene los errores de la red. Los valores que posteriormente son derivados para la matriz Jacobiana pueden ser obtenidos a través de una técnica de retropropagación estándar, que es mucho menos complejo que realizar el cálculo de la matriz Hessiana.

El algoritmo Levenberg-Marquardt adapta el método de Newton y utiliza la aproximación a la matriz Hessiana. El cálculo de los nuevos pesos queda definido, finalmente, por la siguiente ecuación:

wk+1= wk - [J t J + λI] -1 J t e (3)

La constante λ determina la tendencia del algoritmo, cuando es muy pequeño y tiende a cero, y el algoritmo es el método de Newton con la matriz Hessiana aproximada. Cuando λ es grande el algoritmo se convierte en el tradicional descenso por gradiente con un tamaño del paso pequeño.I es la matriz identidad.

La red neuronal artificial se ha implementado utilizando un programa de cálculos matemáticos para las dos estructuras de datos de entrada vistas con anterioridad, y se ha llevado a cabo una etapa de experimentación en la que se ha buscado una configuración de red que otorgara recomendaciones que fueran lo más aproximadas posibles a las recomendaciones hechas con asistencia del especialista, lo cual se puede comprobar contrastando la salida de la red tras procesar los datos de prueba (40 % de las muestras) con la salida esperada para esos datos de prueba.

Durante la experimentación se han ido alterando los siguientes parámetros buscando obtener una efectividad aceptable:

-Cantidad de neuronas en cada capa: cantidad de unidades procesadoras en la capa de entrada, de salida y en las ocultas de la red.
-Cantidad de capas ocultas: la red multicapa por definición se compone de una sola capa de neuronas de entrada y otra de salida. La cantidad de capas ocultas puede variar de acuerdo a las necesidades del problema.
-Función de activación de cada capa: es una función que se aplica sobre el producto escalar del vector de entrada y el vector de pesos en una neurona. Determina el valor de salida de la unidad de procesamiento.
-Objetivo (Goal): el error mínimo esperado. La función de desempeño utilizada ha sido la del error cuadrático medio.
-Iteraciones (It): cantidad de épocas o de actualizaciones de los vectores de pesos de la red neuronal.
-Gradiente mínimo (Min grad): el desempeño mínimo de la gradiente.
-Valor máximo para lambda (Max A): A es un valor adaptativo que determina la tendencia del algoritmo.

Para comprobar la eficiencia de las distintas configuraciones de red en el proceso de prueba, se han utilizado gráficos ROC.

III. RESULTADOS

Además de un análisis basado en la comparación en bruto entre la salida deseada y la proporcionada por la red, en donde el vector de salida de la red debe coincidir exactamente con el vector que representa la recomendación del psicólogo para ser considerada como una recomendación correcta, también se han utilizado los gráficos ROC (Receiver Operating Characteristic).

En un gráfico ROC, cada curva o línea representa la efectividad de una neurona de salida de la red neuronal, al haber cuatro neuronas de salida existen cuatro curvas. El gráfico muestra la relación entre la Tasa de Verdaderos Positivos (TVP) y la Tasa de Falsos Positivos (TFP). Cuanto mayor sea la TVP y menor sea la TFP, los resultados son más precisos para dicha neurona.

Las distintas configuraciones de RNAs en las que se han utilizado dos tests vocacionales han sido descartadas tras la experimentación, por no lograr una eficiencia aceptable.

En la Tabla 1 se presentan cuatro configuraciones estructurales (cantidad de neuronas, funciones de transferencia para cada capa) y de entrenamiento (iteraciones, gradiente mínimo, objetivo y valor máximo para A) utilizadas para la RNA cuyo vector de entrada estaba constituido por los resultados de dos test vocacionales.

Tabla 1. Configuraciones para RNA con salida Hereford y DAT.

Neuronas por Capa Función Capa Oculta 1 Función Capa Salida It Min grad Goal Max λ
A [4,4] sigmoidal sigmoidal 700 10-4 10-4 10300
B [20,4] sigmoidal sigmoidal 700 10-4 10-4 10300
C [20,4] lineal sigmoidal 700 10-100 10-10 10300
D [10,4] sigmoidal sigmoidal 3000 10-100 10-10 10300

La Figura 4 presenta el gráfico ROC de la RNA con la configuración D, de la Tabla I. En este gráfico se observa que una de las neuronas ha tenido una TVP mayor a 0,9 y una TFP menor a 0,3; si bien estas tasas demuestran que para dicha neurona en particular la RNA realiza buenas clasificaciones, hay otras neuronas cuyos resultados no tienen la misma precisión, como la observada en la curva verde, la cual tiene una TVP inferior a 0,5 y una TFP cercana a 0,4 lo cual indica que para esta neurona la red provee resultados casi aleatorios. Las demás configuraciones de RNA han proporcionado resultados similares.

Figura 4. Gráfico ROC de la primera RNA con la configuración D.

La red neuronal con los mejores resultados es una de las que ha tenido como valores de entrada los resultados de un solo test. Un análisis de comparación en bruto demuestra que dicha red ha ofrecido un total de 25 (80,6 %) recomendaciones que coinciden exactamente con aquellas hechas con asistencia profesional, mientras que las recomendaciones no coincidentes han sido 6 (19,4 %).

En la Tabla 2 se presentan las configuraciones utilizadas para las RNAs cuyo vector de entrada estaba compuesto únicamente en los resultados del test DAT, entre las cuales se encuentra la red con configuración G, que ha proporcionado los mejores resultados, ya mencionados con anterioridad.

Tabla 2. Configuraciones para RNA con salida DAT.

Neuronas por Capa Función Capa Oculta 1 Función Capa Oculta 2 Función Capa Salida It Min grad Goal Max A
A [10,4] softmax X sigmoidal 103 10-6 10-6 10300
B [10,4] sigmoidal X sigmoidal 103 10-6 10-6 10300
C [20,4] sigmoidal X sigmoidal 103 10-6 10-6 10300
D [20,4] sigmoidal X sigmoidal 103 10-10 10-10 10300
E [40,4] sigmoidal X sigmoidal 103 10-10 10-10 10300
F [50,4] sigmoidal X sigmoidal 103 10-12 10-12 10300
G [10,10,4] sigmoidal sigmoidal sigmoidal 103 10-10 10-10 10300
H [20,20,4] lineal sigmoidal sigmoidal 103 10-10 10-10 10300

En la Figura 5 se presenta el gráfico ROC de la red con la configuración G, detallada en la Tabla 2.

Figura 5. Gráfico ROC de la RNA con la mejor configuración.

En la Figura 5 se puede observar que en todos los casos la TFP ha sido menor o igual a 0,2 y la TVP ha sido mayor a 0,8; incluso para una de las neuronas se observa un 100 % de precisión, con una TVP con valor 1 y una TFP con valor 0. Por lo tanto, la red proporciona resultados aceptables.

Cabe destacar que las curvas ROC presentadas en este trabajo no tienen la estructura que usualmente se visualiza en este tipo de gráficos (en todos los casos son curvilíneas y no con tendencias rectilíneas). El motivo de esta diferencia se origina en la estructura de los vectores de salida, tanto el de salida esperada como el de salida obtenida, que son utilizados como base para el cálculo de las tasas ROC: los mencionados vectores pueden tener más de un elemento activo (valor 1) al mismo tiempo; mientras que en casos ordinarios para aplicar gráficos ROC se utilizan vectores que pueden tener únicamente un elemento activo para cada vector de salida, es decir, cada objeto de estudio puede pertenecer únicamente a una clase.

A pesar de que ésta no es una forma tradicional de aplicar análisis ROC, las tasas y los gráficos ROC obtenidos se han constituido útiles para la evaluación de los resultados del trabajo y por lo tanto considerados válidos.

IV. DISCUSIÓN

Teniendo en cuenta los resultados obtenidos, principalmente para la segunda RNA que ha logrado Tasas de Verdaderos Positivos mayores a 0,8 y Tasas de Falsos Positivos menores a 0,2, en todas sus neuronas de salida (dada una determinada configuración estructural y de entrenamiento), se puede afirmar que es factible modelar y representar la subjetividad a través de la implementación de Redes Neuronales Artificiales, entendiéndose a la subjetividad como una opinión o recomendación que tiene como base una apreciación personal de un especialista o que es realizada con asistencia del mismo.

Se ha desarrollado un sistema capaz de efectuar recomendaciones con un alto grado de acierto con respecto a las que son realizadas por un psicólogo (80,2 % para la red con mayor precisión). Sin embargo, para llegar a este resultado, el modelado de los datos que son tratados por la red debe hacerse de tal modo que los valores de entrada estén estrechamente relacionados entre sí y que exista un patrón de salida determinado que pueda ser reconocido por la red durante su proceso de entrenamiento, como ha ocurrido cuando la red ha sido entrenada utilizando solamente como valores de entrada los resultados del test DAT. En caso contrario, se pronostica, de acuerdo a los resultados obtenidos en este trabajo, que ocurrirá lo que ha sucedido cuando se utilizaron los resultados tanto del test DAT como del test Hereford como valores de entrada de la red (la red proporciona resultados con bajas TVPs y altas TPFs para sus neuronas), en donde se considera que no existe cohesión entre los resultados de ambos tests, al ser éstos fuentes de estimaciones muy dispares e incluso contradictorias: el primero ofrece evaluaciones acerca de las aptitudes o capacidades del individuo mientras que el otro lo hace acerca de los intereses.

Las características personales de los individuos que realizan las pruebas vocacionales y sus resultados obtenidos no implican un riesgo de que el sistema realice recomendaciones erróneas. Sin embargo, los criterios que el profesional tiene en cuenta para realizar las recomendaciones durante el proceso de entrenamiento sí pueden llevar a que la red aprenda de una forma incorrecta y que, en consecuencia, no recomiende con precisión. Esto ocurriría en caso de que el análisis que haya realizado el profesional sobre las muestras, le lleven a efectuar recomendaciones aleatorias o casi aleatorias, así como también en caso de que el tiempo que le tome realizar las recomendaciones sea demasiado largo como para que sus criterios varíen durante ese período.

V. CONCLUSIÓN

Ha sido desarrollado un sistema capaz de recomendar un área vocacional a uno o varios individuos tras un análisis de los resultados que éstos han obtenido en pruebas vocacionales de aptitudes. Es importante aclarar, sin embargo, que para generar dicha recomendación el sistema sólo tiene en cuenta una serie de variables de entrada que estiman la capacidad que posee el sujeto para desempeñarse en determinadas áreas en el futuro, pero no contempla otros factores de carácter psicológico, social, familiar, económico o de otra índole que también tienen influencia directa en el aprovechamiento de las aptitudes del individuo al momento de que éste tenga que desenvolverse en las mencionadas áreas.

REFERENCIAS

[1] Lázara Grupo Editor, SA. Test CHASIDE de orientación vocacional y laboral, 2011. Sitio web: http://www.estudios.com.ar/test-orientacionvocacional.html

[2] Velásquez Ospina, F.A. “¿En qué consiste la quinta edición del D.A.T? Una aproximación actualizadaa la medición de actitudes”, Avances en Medición, Vol. 6, pp. 175–182, 2008.

[3] Russell, S., Norvig, P. Inteligencia Artificial - Un enfoque moderno, 2da ed., Madrid, 2004.

[4] Acevedo, G., Caicedo, E., Loaiza, H. “Selección de personal mediante redes neuronales artificiales”, Revista de Matemática: Teoría y Aplicaciones, Vol. 14, Nro 1, 2007, pp. 7-20.

[5] Zambrano, C., Rojas, D., Carvajal, K., Acuña, G. “Análisis de rendimiento académico estudiantil usando data warehouse y redes neuronales”, Ingeniare - Revista chilena de ingeniería, Vol. 19, Nro 3, 2011, pp. 369- 381.

[6] Cataldi, Z., Salgueiro, F., Lage, F. “Predicción del rendimiento de los estudiantes y diagnóstico usando redes neuronales artificiales”, XIII Jornadas de Enseñanza Universitaria de la Informática, España, 2006.

[7] Zou, Y., Shen, Y., Shu, L., Wang, Y., Feng, F., Xu, K., Ou, Y., Song, Y., Zhong, Y., Wang, M., Liu, W. “Artificial neural network to assist psychiatric diagnosis”, Br J Psychiatry, Vol. 169, Nro 1, Julio 1996, pp. 7-64.

[8] Tabárez Gutiérrez, R. “El inicio de la web: historia y cronología del hipertexto hasta HTML 4.0 (1990-99)”, ArtefaCToS, Vol. 5, 2012.􀀁

[9] Hills, M., Klint, P., Vinju, J. “An empirical study of PHP feature usage: a static analysis perspective”, Proceedings of the 2013 International Symposium on Software Testing and Analysis, pp. 325-335, 2013.

[10] Panchal, G., Ganatra, A., Kosta, Y.P., Panchal, D. “Behaviour Analysis of Multilayer Perceptrons with Multiple Hidden Neurons and Hidden Layers”, International Journal of Computer Theory and Engineering, Vol. 3, No. 2, April 2011.

[11] Sapna, S., Tamilarasi, A., Pravin, M., “Backpropagation learning algorithm based on Levenberg Marquardt algorithm”, Computer Science & Information Technology (CS & IT ), pp. 393-398, 2012.