Arquitectura de PLN aplicada al contexto de la salud mental
NLP architecture applied to the context of mental health
Alejandro Millan1, Denis Cedeno-Moreno2*
1Universidad Tecnológica de Panamá, Facultad de ingeniería de Sistemas Computacionales
2Grupo de Investigación en Salud Electrónica y Supercomputación
Fecha de recepción: 10 de febrero de 2023;
Fecha de aprobación: 07 de julio de 2023.
*Autor de correspondencia: [email protected]
DOI: https://doi.org/10.33412/idt.v19.2.3770
RESUMEN. A nivel global la situación acarreada por COVID-19, ha creado una realidad preocupante y desalentadora especialmente a los gobiernos en especialmente a las poblaciones más vulnerables por el hecho de desconocer como erradicar la pandemia, muchos no han podido superar los desafíos principalmente emergentes de una enfermedad infecciosa con implicaciones para la salud física y que también ha afectado profundamente la salud mental y el bienestar de las personas. Las afectaciones de salud mental son problemas que nos afectan a todos en algún momento de nuestras vidas, ya sea por experiencias que hemos vivido o incluso factores biológicos. Prestarle la atención y brindar el apoyo necesario en una etapa temprana es la clave para prevenir afectaciones más severas. La disciplina del procesamiento de lenguaje natural (PLN), es una sub área inteligencia artificial (IA) que estudia las interacciones entre las computadoras y el lenguaje que hablamos los humanos. En esta investigación se propone el diseño e implementación de una arquitectura integral basada en componentes de IA, aprendizaje automático (ML) y PLN, la cual nos permitirá detectar y analizar patrones de comportamiento en las personas y generar posibles diagnósticos tempranos a enfermedades de salud mental.
Palabras clave. Inteligencia artificial, procesamiento de lenguaje natural, aprendizaje automático, salud mental, Covid-19.
ABSTRACT. At a global level, the situation caused by COVID-19 has created a worrying and discouraging reality, especially for governments, especially for the most vulnerable populations due to the fact that they do not know how to eradicate the pandemic, many have not been able to overcome the challenges mainly emerging from an infectious disease with implications for physical health and which has also profoundly affected people's mental health and well-being. Mental health affectations are problems that affect all of us at some point in our lives, either due to experiences we have experienced or even biological factors. Paying attention and providing the necessary support at an early stage is the key to preventing more severe effects. The discipline of natural language processing (NLP) is a sub-area of artificial intelligence (AI) that studies the interactions between computers and the language that humans speak. This research proposes the design and implementation of a comprehensive architecture based on AI, machine learning (ML) and PLN components, which will allow us to detect and analyze behavior patterns in people and generate possible early diagnoses of mental health diseases.
Keywords. Artificial intelligence, natural language processing, machine learning, mental health,Covid-19.
1. Introducción
Podemos definir la salud mental como el bienestar emocional de cada persona, esto incluye factores psicológicos y sociales, lo cual afectará de forma directa la forma en que nos sentimos, pensamos y actuamos. La salud mental también determina cómo nos comportamos, reaccionamos y tomamos decisiones en situaciones de estrés, por lo tanto, es un factor importante en todas las etapas de nuestra vida, tanto en la niñez, adolescencia y edad adulta [1]. A nivel global la situación acarreada por COVID-19, ha creado una realidad preocupante y desalentadora especialmente a las poblaciones más vulnerables por el hecho de desconocer como erradicar la pandemia. Mucha de la población panameña, no ha podido superar los desafíos principalmente emergentes de una enfermedad infecciosa con implicaciones para la salud física que también ha afectado profundamente la salud mental y el bienestar.
Las organizaciones panameñas privadas y de gobierno, para subsistir los efectos del Covid-19 han tenido que hacer uso intensivo de herramientas tecnológicas para poder llevar a cabo el teletrabajo, realizar compras y ventas online, actividades académicas, así como gestionar procesos de producción de forma remota lo cual representa un gran reto no solo para las empresas y gobierno, sino también para los colaboradores. Poder aportar con la implementación de herramientas y métodos acertados por parte de los investigadores panameños en áreas de Tecnologías de Información y Comunicación (TIC) que apoyen la toma de decisiones en el sector salud permitiría preparar estrategias en beneficio de la población y proyecciones futuras ante otras pandemias o desastres naturales.
En este proyecto realizaremos una investigación sobre algunos proyectos de investigación desarrollados utilizando IA, ML y PLN para implementar un modelo arquitectónico de sistema inteligente chatbot que a través del análisis de conversaciones orales o escritas pueda brindar apoyo a personas que presenten alguna afectación como ansiedad o depresión.
El resto del documento se compone de sección 2 marco teórico, 3 materiales y métodos, 4 resultados y discusión y 5 conclusiones.
2. Marco Teórico
2.1 Salud mental.
Existen múltiples factores que pueden afectar nuestra salud mental, tanto biológicos, como experiencias vividas ya sea de trauma o abuso y factores genéticos en antecedentes familiares relacionados a problemas de salud mental. Las dos (2) afectaciones más grandes en cuanto a salud mental se refiere, son la depresión y la ansiedad [2]. La depresión es una afectación que causa sentimientos de tristeza y la pérdida de interés en actividades que antes disfrutaba y que puede causar a la persona problemas tanto físicos como emocionales y disminuir la capacidad de funcionamiento en el trabajo y el hogar. Este es un problema que en el 2019 llegó a afectar al 2.8% de los adultos mayores, causándoles síntomas graves de depresión el cual se incrementó con la pandemia de Covid-19. Este porcentaje fue aún mayor en jóvenes de 18 y 29 años, abarcando un 21% de la población [3].
Por otro lado, tenemos la ansiedad, la cual es una emoción que se caracteriza por generar sentimientos de presión o preocupación. Este sentimiento tiene la capacidad de provocar trastornos físicos como el aumento en la presión arterial, sudoración, temblores o mareos. Muy comúnmente la ansiedad es confundida con el miedo, sin embargo, estos sentimientos son diferenciados ya que la ansiedad es una respuesta prolongada enfocada al futuro ante una amenaza difusa; sin embargo, el miedo se caracteriza por ser una respuesta de corta duración enfocada al presente ante una amenaza claramente definida.
2.2 Inteligencia artificial
La IA es la rama de las ciencias de la computación que busca desarrollar o replicar en las computadoras la capacidad de usar algoritmos, aprender de los datos y utilizar lo aprendido en la toma de decisiones de la misma forma como lo haría un ser humano. Brindado los datos necesarios, la inteligencia artificial puede llegar a tener la capacidad de realizar sugerencias o predicciones sobre asuntos importantes y complejos, ofreciendo beneficios en múltiples aspectos de nuestra vida tanto personal como la salud, bienestar y relaciones interpersonales; así como en lo profesional como la educación, trabajo y negocios.
2.3 Aprendizaje automático
Una de las aplicaciones de la inteligencia artificial es el aprendizaje automático, esta tecnología nos abre las puertas a que los desarrollos con inteligencia artificial puedan aprender por sí solos. Esto es posible llevarlo a cabo gracias a la implementación de algoritmos que analizan grandes cantidades de datos para poder obtener aprendizaje o resultados en las distintas situaciones posibles. Con la implementación del aprendizaje automático se logra que el desarrollador no tenga que pensar y programar cada una de las posibles combinaciones [4].
2.4 Procesamiento de Lenguaje Natural
Mediante el uso del PLN podemos facilitar la interacción entre humano y computadora, utilizando el lenguaje natural o lenguaje humano [5]. Esta interacción puede ser hablada o escrita, donde a través de algoritmos o procesos matemáticos se traducen los datos recibidos para que la computadora pueda determinar patrones y generar una respuesta acorde [6].
2.5 Trabajos relacionados.
A continuación, presentamos algunos trabajos interesantes con los aspectos relacionados en esta investigación:
En su estudio [7] construyeron un marco de trabajo en donde utilizaron la integración de tecnologías como IA y nube computacional, en donde se lograron recopilar datos locales de salud mental y física de marinos a bordo de embarcaciones y que estuvieron aislados o en cuarentena por la Covid-19. Cada marino registrado en la aplicación podía registrar los parámetros como: temperatura corporal, frecuencia del pulso, índice de masa corporal, presión arterial, frecuencia cardíaca. Con la aplicación se realizaba un monitoreo a las condiciones regulares de salud del marino. Si se sentía mal o había cambios en los parámetros establecidos la aplicación inteligente alerta al marino y programa una cita inmediata poniéndose en contacto con el centro de emergencias.
En su estudio [8] utilizaron varios métodos de ML y estadísticos, para lograr comprender cómo la pandemia de Covid-19 y el aprendizaje online han impactado el bienestar emocional de estudiantes. Para ello utilizaron datos recopilados por la Universidad de Ljubljana, Eslovenia, en conjunto con un consorcio internacional de universidades, otras instituciones educativas y asociaciones de estudiantes. Sus resultados han indicado que por ejemplo la modalidad de aprendizaje virtual es el principal predictor del estado emocional de los estudiantes y después otro factor fue la seguridad financiera.
Por su parte [9] a través del análisis estadístico y la inferencia de una red Bayesiana identificaron factores claves que afectaron la salud mental durante la pandemia de Covid-19. Integrando estas redes bayesianas con otros enfoques clásicos de ML lograron un modelado eficaz del nivel de salud mental durante la pandemia. Finalmente, con la utilización de estos modelos de aprendizaje automático supervisados se logró un 80 % precisión.
3. Materiales y métodos
Para el desarrollo de este proyecto se siguió una metodología de investigación mixta donde primero se estudiaron los tópicos requeridos del contexto en salud mental, depresión, ansiedad, IA, ML y PLN [10]. Posteriormente se investigaron desarrollos existentes que apunten a solucionar esta misma problemática o similares y finalmente propusimos e implementamos nuestra arquitectura basada en herramientas de PLN.
3.1 Arquitectura propuesta
En la figura 1 se muestra un esquema de nuestra arquitectura. La cual fue desarrollada utilizando tecnologías Web como VueJS para la integración del frontend que visualiza el usuario. Firebase Functions como serverless backend encargado de ser el puente de comunicación entre los mensajes enviados por el usuario y el sistema de PLN, el cual es gestionado por
Figura 1 - Diseño de la arquitectura propuesta.
DialogFlow, herramienta desarrollada por Google con la capacidad de realizar análisis sintácticos mediante texto [11].
Las conversaciones son almacenadas de manera anónima en nuestra base de datos Firebase Firestore. Protegiendo así los datos del usuario, puesto que en Panamá está vigente la ley 81 de protección de datos [12].
La arquitectura propuesta desarrolla un sistema inteligente de tipo chatbot con herramientas de PLN con la capacidad de entablar conversaciones con personas que sientan o estén padeciendo de alguno o múltiples de los síntomas relacionados a la depresión, ansiedad o tendencias suicidas, brindando apoyo emocional al igual que una guía de acciones para quienes estén en búsqueda o requieran de apoyo profesional [13].
A continuación, detallamos los elementos utilizados en el desarrollo de la arquitectura:
a. Framework VueJS: De código abierto desarrollado en Javascript que utiliza el modelo de desarrollo “modelo-vista-modelo” MVC, utilizado para la creación de interfaces de usuario [14]. Como podemos ver en la figura 2, se presenta la pantalla inicial del chatbot. Si deseamos iniciar una nueva conversación, haremos clic en el botón de “Iniciar conversación” esto procederá a ejecutar dos (2) acciones, inicialmente creara un nuevo documento en nuestra base de datos, esto con la intención de ir actualizando en tiempo real la conversación que será llevada a cabo y posteriormente nos llevara a la vista de conversación para empezar a enviar y recibir mensajes de nuestro chatbot.
Figura 2 - Pantalla de inicio.
En la figura 3 podemos ver las dos acciones que son ejecutadas a través de una llamada a nuestra Cloud function inicial, la respuesta al llamado de esta función será el id único de documento generado automáticamente por Cloud Firestore para identificar la conversación.
Figura 3 - Función para inicializar conversación.
b. Base de datos (Cloud Firestore): Base de datos No-SQL proporcionada por Firebase. Cloud Firestore nos permite almacenar en tiempo real las conversaciones entre el usuario y el chatbot, lo cual nos permitirá analizar las interacciones y los mensajes enviados para un mejor entrenamiento del aprendizaje computacional. Los datos almacenados son recolectados de manera anónima para proteger la identidad del usuario. En la figura 4 podemos ver el sistema gestor de base de datos de Cloud Firestore, este está dividido en tres (3) columnas, donde la primera columna corresponde a las colecciones que para este proyecto solo contaremos con una (1) colección que llamaremos “chatSessions”; dentro de esta colección y en la segunda columna podremos ver el listado de documentos, estos documentos corresponden a cada una de las sesiones generadas por los usuarios y a su vez dentro de estas, en la tercera columna, se almacenaran los datos de los mensajes enviados tanto por el usuario como los de respuesta del chatbot.
Figura 3 - Sistema gestor de base de datos.
Los mensajes son almacenados dentro de una estructura de tipo arreglo para mantener el orden cronológico de cada mensaje. Cada mensaje nuevo enviado o generado se ira agregando al final del arreglo.
c. Servidor backend (Cloud Functions): Es un marco de trabajo serverless para desarrollo backend desarrollado en NodeJS. Este backend será el orquestador encargado de realizar las comunicaciones entre el usuario y el sistema de PLN; a su vez también se encargará de crear nuevas sesiones de conversación y almacenar los mensajes en documentos de la base de datos [15].
d. Plataforma de PLN (DialogFlow): Es una plataforma de PLN utilizada para desarrollar integraciones de interfaces de usuario conversacionales para aplicaciones móviles, web, chatbots y sistemas de respuesta de voz interactivos. La implementación de DialogFlow es generada en base a “intents”, los cuales podemos definir como la intención presentada por el usuario al momento de realizar una acción (en este caso, el mensaje enviado) [16].
Si deseamos crear un nuevo intent, este por lo menos debe llevar tres (3) elementos definidos, se debe crear un nombre de identificador; agregarle una o múltiples frases de entrenamiento, estas son las frases iniciales con las que el sistema de PLN realizará comparaciones y así podrá determinar cuál es el intent que mejor corresponde al mensaje enviado por el usuario; y como último punto, se deben ingresar los mensajes de respuesta, estos mensajes de respuesta pueden ser una o múltiples respuestas que se le enviara al usuario en el caso de que un mensaje enviado corresponda con un intent. Para cada mensaje enviado, DialogFlow se encarga de realizar un análisis sintáctico y de esta manera identificar la intención del usuario y finalmente brindar una respuesta acorde. En este proyecto se creó un intent para cada una de las preguntas y respuestas presentadas en los datasets.
3.2. Caso de estudio.
Para el presente estudio llevamos a cabo una serie de experimentos con el fin de medir la efectividad de la arquitectura. A continuación, se proporciona una descripción detallada de estos experimentos.
a. Datasets: El dataset utilizado en este proyecto para entrenar los modelos son listados de preguntas y respuestas relacionadas con la depresión y la ansiedad, utilizados para brindar el entrenamiento inicial a los mensajes que después pueden ser enviados por los usuarios. En conjunto ambos datasets conforman una agrupación de más de 200 preguntas y respuestas. Estos datos fueron obtenidos de repositorio de http://kaggle.com.
4. Resultados y discusión
En este este proyecto obtenemos como resultado una arquitectura integral con una herramienta de PLN que posee un entrenamiento inicial, capaz de entablar conversaciones con sus usuarios para brindar apoyo emocional a sus usuarios y facilitar información importante referente a la salud mental y canales de apoyo a quienes padecen síntomas.
En la figura 5 tenemos la pantalla de conversación, en esta vista podremos escribir nuevos mensajes y recibir respuesta de nuestro chatbot, al enviar un nuevo mensaje se ejecuta el Cloud function y este recibe el mensaje del usuario para su procesamiento, almacenamiento y respuesta.
Figura 5 - Pantalla de conversación.
Las contribuciones de nuestro trabajo son varias (1) diseñar una arquitectura basada en TIC que permita interactuar a través de un chatbot con personas para el manejo de afecciones psicológicas, basado en la utilización de componentes como IA y PLN (2) apoyar a los encargados de la salud mental en Panamá ya que a través de la herramienta las personas pueden ser orientados alternativamente a realizar algunas acciones que mejoren su estado anímico y (3) proponer un marco teórico y práctico a los investigadores panameños a que puedan contribuir en la mejora de esta arquitectura.
5. Conclusión
Crear nuevos desarrollos utilizando PLN conlleva muchos retos para obtener los resultados deseados, contextualizar las palabras o frases enviadas por los usuarios requiere un alto nivel de análisis para poder discernir de manera automática entre las ambigüedades, sinónimos, coloquialismos e incluso sarcasmo.
Todos estos retos se amplifican aún más cuando trabajamos en relación con temas de la salud mental, el poco acceso a datos o información sobre diálogos entablados con pacientes que padecen alguna afectación limita potencialmente los entrenamientos requeridos para el aprendizaje automático.
6. Agradecimientos
Agradecemos al Sistema Nacional de Investigación (SNI). Así como a la Facultad de Ingeniería de Sistemas Computacionales de la UTP.
7. Referencias
[1] C. Rauschenberg et al., “Social isolation, mental health, and use of digital interventions in youth during the COVID-19 pandemic: A nationally representative survey,” Eur. Psychiatry, vol. 64, no. 1, 2021, doi: 10.1192/j.eurpsy.2021.17.
[2] V. Leiva- Peña, P. Rubí-González, and B. Vicente-Parada, “Determinantes sociales de la salud mental: políticas públicas desde el modelo biopsicosocial en países latinoamericanos,” Rev. Panam. Salud Pública, vol. 45, p. 1, 2021, doi: 10.26633/rpsp.2021.158.
[3] L. Lei, X. Huang, S. Zhang, J. Yang, L. Yang, and M. Xu, “Comparison of Prevalence and Associated Factors of Anxiety and Depression among People Affected by versus People Unaffected by Quarantine during the COVID-19 Epidemic in Southwestern China,” Med. Sci. Monit., vol. 26, pp. 1–12, 2020, doi: 10.12659/MSM.924609.
[4] Y. Ren, “Python Machine Learning:Machine Learning and Deep Learning With Python,” Int. J. Knowledge-Based Organ., vol. 11, no. 1, pp. 67–70, 2021.
[5] D. Cedeño Moreno and M. Vargas-Lombardo, “Design and Construction of a NLP Based Knowledge Extraction Methodology in the Medical Domain Applied to Clinical Information,” Healthc. Inform. Res., vol. 24, no. 4, p. 376, 2018, doi: 10.4258/hir.2018.24.4.376.
[6] M. J. Acosta, G. Castillo-Sánchez, B. Garcia-Zapirain, I. de la Torre Díez, and M. Franco-Martín, “Sentiment analysis techniques applied to raw-text data from a csq-8 questionnaire about mindfulness in times of covid-19 to improve strategy generation,” Int. J. Environ. Res. Public Health, vol. 18, no. 12, 2021, doi: 10.3390/ijerph18126408.
[7] Y. Shi et al., “Knowledge and attitudes of medical staff in Chinese psychiatric hospitals regarding COVID-19,” Brain, Behav. Immun. - Heal., vol. 4, p. 100064, 2020, doi: 10.1016/j.bbih.2020.100064.
[8] M. Rezapour and S. K. Elmshaeuser, “Artificial Intelligence-Based Analytics for Impacts of COVID-19 and Online Learning on College Students ’ Mental Health,” no. January 2020.
[9] I. P. Jha, R. Awasthi, A. Kumar, V. Kumar, and T. Sethi, “Learning the mental health impact of COVID-19 in the United States with explainable artificial intelligence: Observational study,” JMIR Ment. Heal., vol. 8, no. 4, 2021, doi: 10.2196/25097.
[10] Z. F. Khan and S. R. Alotaibi, “Applications of Artificial Intelligence and Big Data Analytics in m-Health: A Healthcare System Perspective,” J. Healthc. Eng., vol. 2020, 2020, doi: 10.1155/2020/8894694.
[11] C. Khawas and P. Shah, “Application of Firebase in Android App Development-A Study,” Int. J. Comput. Appl., vol. 179, no. 46, pp. 49–53, 2018, doi: 10.5120/ijca2018917200.
[12] E. R. Pike and M. Ll, “Defending Data : Toward Ethical Protections and Comprehensive Data Governance,” Emory Law Journal, Forthcom., vol. 69, no. 4, p. 51, 2019, [Online]. Available: https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3369746.
[13] N. Ouerhani, A. Maalel, H. Ben Ghézala, and S. Chouri, “Smart Ubiquitous Chatbot for COVID-19 Assistance with Deep learning Sentiment Analysis Model during and after quarantine,” 2020, doi: 10.21203/rs.3.rs-33343/v1.
[14] N. Patrylo and M. Miłosz, “Comparison of AngularJS and VueJS frameworks efficiency,” J. Comput. Sci. Inst., vol. 5, pp. 204–207, 2017, doi: 10.35784/jcsi.622.
[15] S. Bhatt, F. Patwa, and R. Sandhu, “An Access Control Framework for Cloud-Enabled Wearable Internet of Things,” Proc. - 2017 IEEE 3rd Int. Conf. Collab. Internet Comput. CIC 2017, vol. 2017-Janua, pp. 328–338, 2017, doi: 10.1109/CIC.2017.00050.
[16] S. S. Ranavare and R. S. Kamath, “Artificial Intelligence based Chatbot for Placement Activity at College Using DialogFlow,” Our Herit., vol. 68, no. 30, pp. 4806–4814, 2020, [Online]. Available: https://www.researchgate.net/publication/347948058.