INTRODUCCIÓN
Los síntomas depresivos son manifestaciones físicas y psicológicas que deterioran la calidad de la vida de quienes la padecen 1, siendo en muchos casos, expresiones de trastornos depresivos como la distimia, el trastorno depresivo mayor 2, entre otros, así como expresiones de trastornos mentales de mayor complejidad como la esquizofrenia, el trastorno bipolar, la psicosis 3. En el mundo, la depresión afecta a alrededor de 300 millones de personas, correspondiendo a aproximadamente 5% de la población mundial 4. En Latinoamérica, alrededor de 22% de la población padece de síntomas depresivos y/o de ansiedad 5. La prevalencia de síntomas depresivos en el Perú se ha estimado que se encuentra hasta en 14% en la población urbana y 13% en la población rural 6.
La aplicación de algoritmos supervisados de aprendizaje como el árbol de decisiones u otras herramientas del machine learning han sido utilizados con éxito en los últimos años como sistemas para producir modelos predictivos de problemas de salud en estudios extranjeros 7. La utilización de ambos puede ayudar a identificar grupos con características especialmente vulnerables a padecer diversos tipos de enfermedades y trastornos 8, así como síntomas depresivos, y a su vez, el modelado predictivo podría aplicarse con una periodicidad anual para determinar cambios en el perfil de vulnerabilidad en el campo de la salud mental de la población peruana. Por ello, el objetivo de esta investigación fue determinar los grupos especialmente vulnerables a tener síntomas depresivos según factores sociodemográficos mediante algoritmo de árbol de decisiones por aprendizaje automático.
MATERIAL Y MÉTODOS
Diseño y población de estudios
Se aplicó un estudio observacional, retrospectivo, descriptivo y transversal en una base a datos nacional de la Encuesta Demográfica y de Salud Familiar Peruana (ENDES-2022). La ENDES es una encuesta poblacional de muestreo complejo, probabilístico, bietápico e independiente 9. La población seleccionada para el desarrollo de este estudio estuvo conformada por los adultos que tuvieron los criterios de inclusión: ser mayor de 18 años y de ambos sexos que hayan respondido el cuestionario de salud del paciente-9 (PHQ-9) para síntomas depresivos. Al ser un estudio proveniente de una fuente secundaria, no hubo criterios de exclusión. Debido a que se contó con el total de la población registrada en la base de datos secundaria, no se precisó del desarrollo de procedimientos de selección y cálculo de tamaño de la muestra y, por tanto, se estudió el total de la población la cual estuvo conformada por 32.062 adultos mayores de 18 años.
Variables y mediciones
La variable dependiente fue la presencia de síntomas depresivos, definido como la sintomatología del trastorno depresivo caracterizado por bajo estado de ánimo, tristeza, afectación del comportamiento, actividad física y del pensamiento. La determinación de la presencia de síntomas depresivos en la ENDES-2022 se realizó mediante la sumatoria de los puntajes del cuestionario PHQ-9 (9-question Patient Health Questionnaire), el cual evalúa al paciente según los síntomas depresivos acorde a los criterios del Manual Diagnóstico y Estadístico de los Trastornos Mentales de la Asociación Americana de Psiquiatría 10. Se asignó a cada pregunta una puntuación de 0 a 4 con el fin de obtener una sumatoria que determine la ausencia o presencia de síntomas depresivos de intensidad gradual (leve, moderada, moderada grave y severa), considerándose 0 a 4 puntos como ausencia, de 5 a 9 puntos como depresión leve, de 10 a 14 puntos depresión moderada, de 15 a 19 puntos depresión moderada grave, y de 20 a 27 puntos como depresión severa 11. Finalmente fue dicotomizado para fines de la investigación en sin depresión/con depresión. El cuestionario evalúa la presencia de síntomas depresivos mas no diagnostica trastornos depresivos como el trastorno depresivo mayor el cual requiere la evaluación por el médico psiquiatra 12.
Las variables explicativas fueron: grupo de edad dividido en: de 18 a 38 años (adulto joven) y de 39 años en adelante (adulto intermedio y adulto mayor), tipo de lengua materna, dividido en castellano y lenguas originarias, grupo étnico, dividido en mestizo y no mestizo, nivel educativo, dividido en: hasta secundaria y técnico-universitario, edad de inicio de consumo de alcohol, dividido en hasta los 24 años y de 25 años en adelante, consumidor de alcohol, dicotomizado en si/no, estado civil, dicotomizado en sin pareja/con pareja, sexo, dicotomizado en masculino y femenino.
Análisis estadístico
Se utilizó el algoritmo de árbol de decisiones a través de la detección automática de interacciones mediante chi-cuadrado (CHAID), el cual es un algoritmo rápido de árbol estadístico y multidireccional, que produce segmentos y perfiles respecto al resultado obtenido 13. Consigue la detección automática de interacciones entre variables mediante Ji-cuadrado 14. En cada paso, CHAID elige la variable predictora independiente que posee la interacción más fuerte con la variable dependiente 15. En el árbol de decisiones se elige los nodos principales según el mayor valor del Ji-cuadrado, descendiendo por cada nodo hasta el nodo terminal, para obtener las variables que poseen la mayor interacción con la variable dependiente. Esta medición fue realizada en el programa SPSS statistics 25TM en la ruta: analizar-calcular-árbol 16.
Consideraciones éticas
La base de datos abiertos de libre acceso no incluyó datos personales, se obtuvo de una fuente secundaria (https://www.datosabiertos.gob.pe/)17 proveniente de un organismo estatal (Instituto Nacional de Estadística e Informática), por lo que no hubo ningún dato que permitiera conocer la identidad de la unidad de análisis (los participantes de la encuesta), por lo que no se precisó de la autorización de un comité de ética.
RESULTADOS
Tras la aplicación del algoritmo de árbol de decisiones se encontró que las variables significativas para incluirse en el modelo correspondiente a la presencia de síntomas depresivos en mujeres peruanas fueron: grupo de edad, tipo de lengua materna, grupo étnico, nivel educativo alcanzado, edad de inicio de consumo de alcohol, consumo de bebidas alcohólicas, estado conyugal, siendo el grupo de edad la variable principal predictora. Asimismo, el modelo clasificó de forma correcta el 70,50% de casos de presencia de síntomas depresivos. En hombres, las variables incluidas en el algoritmo fueron: grupo de edad, estado conyugal, consumo de bebidas alcohólicas, nivel educativo alcanzado y tipo de lengua materna, observándose que el modelo clasificó de forma correcta el 83,10% de casos de síntomas depresivos. Asimismo, considerando el total de la población sin distinción de sexo, las variables incluidas en el algoritmo fueron: sexo, tipo de lengua materna, estado conyugal, grupo de edad, nivel educativo alcanzado, clasificando de forma correcta el 75,80% de los casos de síntomas depresivos (tabla 1).
Mujeres-método CHAID (detector automático de interacción Chi-cuadrado) | |
---|---|
Total de población estudiada | 18.241 mujeres |
Variable dependiente | Presencia de síntomas depresivos |
Variables independientes | Grupo de edad, tipo de lengua materna, grupo étnico, nivel educativo alcanzado, edad de inicio de consumo de alcohol, consumo de bebidas alcohólicas, estado conyugal |
Variables independientes incluidas | Grupo de edad, estado conyugal, consumo de bebidas alcohólicas, nivel educativo alcanzado, tipo de lengua materna |
Número de nodos | 18 |
Número de nodos terminales | 10 |
Profundidad | 3 |
Porcentaje | 70,50% |
Estimación de riesgo | 0,29 |
Hombres-método CHAID (detector automático de interacción Chi-cuadrado) | |
Total de población estudiada | 13.821 |
Variable dependiente | Presencia de síntomas depresivos |
Variables independientes | Grupo de edad, tipo de lengua materna, grupo étnico, nivel educativo alcanzado, edad de inicio de consumo de alcohol, consumo de bebidas alcohólicas, estado conyugal |
Variables independientes incluidas | Tipo de lengua materna, estado conyugal, nivel educativo alcanzado, grupo de edad |
Número de nodos | 14 |
Número de nodos terminales | 8 |
Profundidad | 3 |
Porcentaje | 83,10% |
Estimación de riesgo | 0,169 |
Ambos sexos-método CHAID (detector automático de interacción Chi-cuadrado) | |
Total de población estudiada | 32.062 |
Variable dependiente | Presencia de síntomas depresivos |
Variables independientes | Grupo de edad, tipo de lengua materna, grupo étnico, nivel educativo alcanzado, edad de inicio de consumo de alcohol, consumo de bebidas alcohólicas, estado conyugal, sexo |
Variables independientes incluidas | Sexo, tipo de lengua materna, estado conyugal, grupo de edad, nivel educativo alcanzado |
Número de nodos | 16 |
Número de nodos terminales | 9 |
Profundidad | 3 |
Porcentaje | 75,80% |
Estimación de riesgo | 0,242 |
Se observó que las variables que están principalmente asociadas al desarrollo de síntomas depresivos en mujeres peruanas fueron los correspondientes a la secuencia del nodo 2 (adultos desde los 39 años), el nodo 5 (educación hasta secundaria) y el nodo 13 (lengua materna originaria). Otro grupo de interés fue el correspondiente a la secuencia correspondiente a los nodos 1 (adultas jóvenes), nodo 3 (sin pareja) y el nodo 8 (consumidoras de bebidas alcohólicas) (gráfico 1).
En hombres, la secuencia de nodos que se asociaron principalmente a la presencia de síntomas depresivos fueron el nodo 2 (lengua materna originaria), nodo 6 (adultos desde los 39 años) y el nodo 11 (nivel educativo alcanzado hasta secundaria) (gráfico 2).
En el total de la población peruana (incluyendo ambos sexos indistintamente) la secuencia de nodos que se asociaron principalmente a la presencia de síntomas depresivos fueron el nodo 2 (sexo femenino), nodo 6 (adultos desde los 39 años) y nodo 13 (nivel educativo alcanzado hasta secundaria) (gráfico 3).
DISCUSIÓN
Si bien la depresión es un problema que aqueja a ambos sexos y que está en aumento en Perú 18, según el algoritmo de árbol de decisiones, la población más susceptible a desarrollar síntomas depresivos en la población peruana fueron las mujeres desde los 39 años y que solo tuvieron estudios escolares hasta la secundaria. La edad como factor asociado al desarrollo de síntomas depresivos guarda relación con los aspectos biológicos del envejecimiento físico y mental 19, así como por los efectos del estrés socioemocional y socioeconómico 20. El haber alcanzado como máximo nivel educativo la secundaria es un factor relacionado a la sintomatología depresiva debido a que el carecer de formación técnica o universitaria suponen una menor posibilidad de estar desempleados 21 y, por tanto, tener menos problemas socioeconómicos que los predispongan al estrés físico y mental (22 que pueden preceder al desarrollo de depresión, habiéndose sugerido que el tener estudios universitarios podría ser un factor protector frente a la depresión 23.
Se observó que el pertenecer al sexo femenino estuvo más asociado a una mayor predisposición para desarrollar síntomas depresivos. Las mujeres inherentemente son más susceptibles a síntomas depresivos que los hombres debido a un conjunto de factores biológicos y sociales 24. Entre los biológicos, muestran mayor susceptibilidad debido a que enfrentan posibles trastornos relacionados a cambios adaptativos biológicos hormonales, como el trastorno disfórico premenstrual, la depresión posparto y la depresión y/o ansiedad posmenopáusica 25, así como la fluctuación de niveles de estrógenos que, cuando se reducen sus concentraciones séricas, provocan una disminución del neurotransmisor serotonina 26. Así mismo, por las diferencias relacionadas a los núcleos cerebrales sexualmente dimórficos en el hipotálamo 27, por lo que la mayor predisposición a padecer síntomas depresivos se extiende más allá de los cambios hormonales estrogénicos.
Asimismo, el que las mujeres con bajo nivel educativo y de edad mayor o igual a 39 años sean el grupo más susceptible a padecer depresión se explica por las dificultades relacionadas a la pobreza, ya que el Perú, como país en vías de desarrollo, con graves problemas de inflación, desempleo e inseguridad 28, mantener la estabilidad de un hogar puede ser más difícil cuando no hay miembros que puedan aportar económicamente. Esta situación empeora si la mujer no tiene estudios que le permitan obtener tener un empleo estable con salarios dignos, y que significa una mayor dificultad cuando se tiene una edad que la hace menos competitiva frente a personas más jóvenes. Estos problemas se ven agravados debido a, como muchos países en desarrollo, a estereotipos de género, con tratos preferenciales en educación, trabajo y prioridades sociales para los hombres, en detrimento de las mujeres 29.
Respecto a la problemática de sintomatología depresiva en hombres, se encontró similitudes comparando el árbol de decisiones del sexo femenino, diferenciándose en la prioridad de los nodos principales, ya que la principal variable asociada fue la lengua materna originaria, sumándose al perfil de este grupo la edad y el bajo nivel educativo. Ello concuerda con el hecho de que los hombres cuyas lenguas maternas son originarias residen en localidades con limitado o insuficiente acceso a la educación técnica o universitaria que les permitan mejores condiciones socioeconómicas para mantener una estabilidad familiar sólida 30, problemáticas que se agravan conforme avanza la edad de los afectados, predisponiéndolos a la angustia, ansiedad y la depresión.
Las limitaciones de esta investigación fueron el uso de una fuente secundaria como la ENDES. Sin embargo, las características de esta encuesta cuyo muestreo fue complejo, probabilístico, bietápico e independiente, además del tamaño de la población estudiada (32.062), permiten considerar que los resultados pueden ser extrapolables a la población nacional. Asimismo, podría haber variables más relevantes desde el aspecto socioeconómico y demográfico, como los índices de pobreza, ingresos anuales, situación laboral actual, número de integrantes del hogar, entre otros, que no fueron incluidos al no formar parte de la encuesta de donde provinieron los datos.
En conclusión, el principal grupo sociodemográfico asociado al desarrollo de síntomas depresivos son el sexo femenino, desde los 39 años y cuya educación ha llegado a la etapa escolar. Asimismo, el uso de algoritmos de aprendizaje automático (machine learning) es de utilidad para crear herramientas de detección y cribado de poblaciones especialmente vulnerables a padecer síntomas depresivos. Es necesaria la atención hacia los grupos vulnerables mediante políticas gubernamentales orientadas a la mejora de la calidad de vida de las poblaciones afectadas, según las características que presenta cada grupo. La detección puede mejorar con la inclusión de más variables sociodemográficas en la Encuesta Nacional Demográfica y de Salud de forma anual para evaluar la evolución del modelo hacia otros grupos poblacionales potencialmente sensibles al desarrollo de síntomas depresivos. Asimismo, es necesario el desarrollo de modelos complejos mediante data science, deep learning, redes neuronales, entre otros, por parte de investigadores con conocimientos en programación, fomentados por el gobierno e instituciones relacionadas a problemáticas sociales y de salud mental.