INTRODUCCIÓN
La capacidad de medir y evaluar el desempeño de los sistemas de salud es esencial para la toma de decisiones informadas, la asignación eficiente de recursos y la mejora continua de los servicios prestados a la población. Esta tarea es compleja debido a la diversidad de factores que influyen en la salud pública1. En la actualidad, la gestión efectiva de los sistemas de salud pública se ha convertido en un pilar para garantizar el bienestar y la calidad de vida de la población. En este contexto, la medición y evaluación de los indicadores de gestión desempeñan pueden proporcionar información objetiva y cuantitativa que permita tomar decisiones informadas, optimizar recursos y mejorar la eficiencia en la prestación de servicios de salud2.
En el caso específico de Paraguay, un país con desafíos y oportunidades singulares en el ámbito de la salud pública, la necesidad de contar con un instrumento sólido y preciso para medir estos indicadores se vuelve imperante3. Si bien existe un conjunto de indicadores y dimensiones sobre la gestión de la salud pública, estos no fueron diseñados para ser válidos y confiables, sino más bien para cumplir objetivos, control de metas y presencia o ausencia de ciertos parámetros considerados como de gestión de salud pública.
La gestión de la salud pública implica la coordinación y el control de una amplia gama de procesos, recursos y servicios que afectan directamente la salud y el bienestar de la población. La identificación y definición de los indicadores clave de gestión en este contexto son esenciales para evaluar el desempeño y el impacto de las políticas y programas de salud implementados. Sin embargo, la mera identificación de estos indicadores no es suficiente; es igualmente crucial contar con dimensiones y criterios medibles y evaluables que permitan una evaluación precisa y completa de la gestión en salud pública.
Es necesario contar con indicadores mensurables para mejorar la formulación de políticas de salud pública basadas en evidencia, abordando el desafío de fundamentar las políticas de salud en evidencia sólida4 centrada en la papel de los administradores de salud pública de base, en particular el Ministerio de Salud de los gobiernos. Por ejemplo, durante la pandemia de COVID-19 en Sri Lanka se ha destacado la función crítica de los administradores de salud locales en los esfuerzos de preparación y respuesta a una pandemia5.
El propósito de esta investigación es, por lo tanto, abordar la necesidad de un instrumento de medición sólido y confiable para los indicadores de gestión en salud pública en Paraguay. Al considerar las propiedades psicométricas, esta investigación aspira a contribuir al campo de la administración y gestión de la salud pública, proporcionando una herramienta eficaz para evaluar y mejorar la toma de decisiones y la efectividad de las políticas y programas de salud en el país.
METODOLOGÍA
Diseño y muestreo
El diseño de la investigación es observacional, descriptivo de corte transversal y temporalmente prospectivo. La población estuvo conformada por todos los actores que hacen al sistema de salud público: profesionales de la salud, directivos y usuarios de salud. Fueron tomados como muestra sujetos que cumplan con los criterios de inclusión.
Se incluyó a profesionales de la salud, directivos y usuarios del sistema de salud pública que aceptaron participar de la investigación de forma libre y voluntaria y dentro del marco temporal de la investigación. En cuanto al cálculo del tamaño muestral, no se ha definido un concepto único sobre cuántos sujetos se necesitan para la validación y creación de una escala. Sin embargo, algunos autores afirman que para una carga factorial de 0,4 (mínima carga factorial que se aceptó como óptima en el marco de esta tesis) se requiere un número mínimo de 200 sujetos, esto con una potencia del 80 % y un nivel de confianza del 95 %6.
Técnicas e instrumentos de recolección de datos
En primer lugar, se ha definido un conjunto de indicadores. En segundo lugar, se realizó una validación por juicio de expertos, fueron escogidos cinco expertos en dirección y gestión se salud pública, así como expertos en psicometría, los cuales fueron encuestados sobre la pertinencia, suficiencia y coherencia de los indicadores. Se calculó la V de Aiken con el fin de determinar cuáles ítems fueron válidos según la primera validación.
Posterior a los ajustes realizados por el resultado de la validación por expertos se usaron dos encuestas, primero una encuesta ad hoc para recolectar información sociodemográfica básica y en segundo lugar el instrumento validado por expertos. Este último se valió utilizando análisis factorial (exploratorio y confirmatorio).
Definición de las variables y tratamiento de datos
Las variables son edad (en años cumplidos), sexo (hombre, mujer), actor del sistema de salud (médico, director, usuario), dimensiones (Dimensión 1: Innovación y Colaboración en Salud Pública. Dimensión 2: Gestión y Eficiencia en Salud Pública. Dimensión 3: Planificación y Participación en Salud Pública). Los datos fueron analizados utilizando estadística descriptiva mediante el programa SPSS versión 29. Se calculó el indicador V de Aiken. Para la validación de constructo se utilizó análisis factorial exploratorio y análisis factorial confirmatorio, previa prueba KMO y de esfericidad con el programa JASP. Los gráficos estadísticos fueron realizados con el programa RStudio.
Para la validez de contenido se utilizó la validación de juicio de expertos, en la que se consultó a cinco expertos sobre claridad, coherencia y relevancia, asignando puntuaciones de 1 (no cumple los criterios) a 4 (alto nivel de cumplimiento). La claridad indica que se entiende el ítem, es decir, su sintáctica y semántica son adecuadas; la coherencia se refiere a que el ítem tiene una relación lógica con la dimensión que se mide; La relevancia indica si el elemento es esencial o importante, es decir, debe incluirse. Se calculó la V de Aiken y los intervalos de confianza del 95% para establecer el acuerdo entre los jueces. La V de Aiken es una medida estadística que se utiliza para evaluar la coherencia entre dos o más jueces o evaluadores clasificando un conjunto de observaciones en categorías discretas. La v de Aiken varía de 0 a 1, donde 0 indicaba que no había acuerdo y 1 indicaba que hay acuerdo perfecto. Una V de Aiken mayor a 0,70 indica que el ítem es válido7.
Para la validez de constructo se utilizó la prueba de adecuación de la muestra de Kaiser-Meyer-Olkin (KMO) y la prueba de esfericidad de Bartlett para evaluar la pertinencia de realizar un análisis factorial. Primero, se realizó un análisis factorial exploratorio (AFE) factorizando los ejes principales y la rotación promax para calcular las cargas factoriales y eliminar aquellas que eran inferiores a 0,48. La muestra se dividió en dos submuestras (una del 10 % y otra del 90 %), en la primera submuestra se realizará AFE para identificar el número de factores de la escala, considerando valores propios mayores a uno, con factorización de los ejes principales y rotación promax.
En la segunda submuestra se realizó un análisis factorial confirmatorio (AFC). Para el AFC se utilizó un procedimiento de estimación de máxima verosimilitud (ML), considerando el tamaño de la muestra. El análisis factorial se realizó utilizando el Amazing Statistics Program (JASP) de Jeffrey9. El ajuste del modelo se probó utilizando chi-cuadrado (χ2), índice de ajuste comparativo (CFI), índice de ajuste normado (NFI), índice de Tucker- Lewis (TLI), raíz del error cuadrático medio de aproximación (RMSEA) y raíz media estandarizada. residual cuadrado (SRMSR). Estos índices detectan si el modelo de ajuste es bueno (RMSEA y SRMSR<0,05 y CFI y TLI >0,95) o aceptable (RMSEA y SRMSR entre 0,05 y 0,08, y CFI y TLI entre 0,90 y 0,95)10. La validez de criterio y la confiabilidad se midieron utilizando el omega de McDonald (ω) y al alfa de Cronbach. La consistencia interna es aceptable si el alfa de Cronbach o el omega de McDonald se encuentran entre 0,70 y 0,79; bajo condiciones más exigentes se prefieren valores entre 0,80 y 0,9011.
Cuestiones éticas
El estudio no tiene implicancias éticas, puesto que no existe manipulación de variables. Igualmente se respetaron los principios de autonomía, beneficencia y no maleficencia. Los encuestados dieron sus consentimiento para participar de la investigación como requisito para acceder a los instrumentos. Se garantizó el anonimato de los encuestados, así como el uso de los datos solo para cumplir con los fines de la investigación.
RESULTADOS
En total 4077 personas han participado de la encuesta online, fueron excluidos en total 1459 sujetos, la principal razón fue que muchos eran menores de edad y otros no han usado el servicio de salud pública en el último año lo cual podría impedir que su opinión sea de utilidad teórica en el análisis de los datos. La primera submuestra de 257 sujetos se usa para el análisis factorial exploratorio y la otra submuestra de 2361 sujetos se usa para el análisis factorial confirmatorio.
El 88,73 % son hombres. El 92,63 % de los participantes fueron usuarios (pacientes) de servicios de salud pública. El 88,27 % viven en área urbana. El 47,10 % son del departamento Central. El 64,31 % no tiene ningún tipo de seguro médico, y algunos con seguro médico privado incluso, igualmente consultan en servicios de salud pública (9,47 %). El nivel de estudios principal fue universitario con 54,62 %. El nivel de ingresos del 47,29 % fue menos del salario mínimo. El promedio de edad fue de 29 ( 8 años con una mediana de 28 años y un rango entre 18 y 70 años. Las edades principalmente estuvieron en el grupo de entre 20 y 40 años (Tabla 1).
Características | Frecuencia | Porcentaje |
---|---|---|
Sexo | ||
Hombre | 295 | 11,27 |
Mujer | 2323 | 88,73 |
Rol en el sistema de salud público | ||
Directivo | 8 | 0,31 |
Profesional de la salud | 185 | 7,07 |
Usuario | 2425 | 92,63 |
Área de residencia | ||
Rural | 307 | 11,73 |
Urbana | 2311 | 88,27 |
Residencia | ||
Asunción | 586 | 22,38 |
Central | 1233 | 47,10 |
Interior | 799 | 30,52 |
Seguro médico | ||
No | 1684 | 64,32 |
Sí, IPS | 686 | 26,20 |
Sí, seguro privado | 248 | 9,47 |
Nivel de estudios | ||
Sin estudios formales | 28 | 1,07 |
Primaria | 49 | 1,87 |
Secundaria | 577 | 22,04 |
Terciaria | 534 | 20,40 |
Universitaria | 1430 | 54,62 |
Nivel de ingresos | ||
Menos del salario mínimo | 1238 | 47,29 |
Salario mínimo | 733 | 28,00 |
Más del salario mínimo | 647 | 24,71 |
Como se observa en la Tabla 2 todas las preguntas son válidas teniendo en cuenta la opinión de los expertos, puesto que todos los valores de V de Aiken son superiores a 0,7 puntos en cuanto a coherencia, relevancia y claridad.
Ítem | Coherencia (n = 5) | Relevancia (n = 5) | Claridad (n = 5) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
M | DE | V | IC95% | M | DE | V | IC95% | M | DE | V | IC95% | |
Ítem 1 | 3,80 | 0,45 | 0,93 | 0,7-0,99 | 3,80 | 0,45 | 0,93 | 0,7-0,99 | 3,80 | 0,45 | 0,93 | 0,7-0,99 |
Ítem 2 | 4,00 | 0,00 | 1,00 | 0,8-1 | 3,80 | 0,45 | 0,93 | 0,7-0,99 | 3,80 | 0,45 | 0,93 | 0,7-0,99 |
Ítem 3 | 3,80 | 0,45 | 0,93 | 0,7-0,99 | 4,00 | 0,00 | 1,00 | 0,8-1 | 3,80 | 0,45 | 0,93 | 0,7-0,99 |
Ítem 4 | 4,00 | 0,00 | 1,00 | 0,8-1 | 4,00 | 0,00 | 1,00 | 0,8-1 | 4,00 | 0,00 | 1,00 | 0,8-1 |
Ítem 5 | 4,00 | 0,00 | 1,00 | 0,8-1 | 3,80 | 0,45 | 0,93 | 0,7-0,99 | 4,00 | 0,00 | 1,00 | 0,8-1 |
Ítem 6 | 3,80 | 0,45 | 0,93 | 0,7-0,99 | 4,00 | 0,00 | 1,00 | 0,8-1 | 3,60 | 0,55 | 0,87 | 0,62-0,96 |
Ítem 7 | 4,00 | 0,00 | 1,00 | 0,8-1 | 4,00 | 0,00 | 1,00 | 0,8-1 | 3,80 | 0,45 | 0,93 | 0,7-0,99 |
Ítem 8 | 4,00 | 0,00 | 1,00 | 0,8-1 | 4,00 | 0,00 | 1,00 | 0,8-1 | 3,80 | 0,45 | 0,93 | 0,7-0,99 |
Ítem 9 | 4,00 | 0,00 | 1,00 | 0,8-1 | 3,80 | 0,45 | 0,93 | 0,7-0,99 | 3,60 | 0,55 | 0,87 | 0,62-0,96 |
Ítem 10 | 3,60 | 0,55 | 0,87 | 0,62-0,96 | 3,80 | 0,45 | 0,93 | 0,7-0,99 | 3,60 | 0,55 | 0,87 | 0,62-0,96 |
Ítem 11 | 3,60 | 0,55 | 0,87 | 0,62-0,96 | 4,00 | 0,00 | 1,00 | 0,8-1 | 3,80 | 0,45 | 0,93 | 0,7-0,99 |
Ítem 12 | 4,00 | 0,00 | 1,00 | 0,8-1 | 4,00 | 0,00 | 1,00 | 0,8-1 | 3,60 | 0,89 | 0,87 | 0,62-0,96 |
Ítem 13 | 3,80 | 0,45 | 0,93 | 0,7-0,99 | 3,80 | 0,45 | 0,93 | 0,7-0,99 | 3,60 | 0,55 | 0,87 | 0,62-0,96 |
Ítem 14 | 3,80 | 0,45 | 0,93 | 0,7-0,99 | 4,00 | 0,00 | 1,00 | 0,8-1 | 3,80 | 0,45 | 0,93 | 0,7-0,99 |
Ítem 15 | 4,00 | 0,00 | 1,00 | 0,8-1 | 4,00 | 0,00 | 1,00 | 0,8-1 | 3,60 | 0,55 | 0,87 | 0,62-0,96 |
Ítem 16 | 3,80 | 0,45 | 0,93 | 0,7-0,99 | 4,00 | 0,00 | 1,00 | 0,8-1 | 3,80 | 0,45 | 0,93 | 0,7-0,99 |
Ítem 17 | 3,80 | 0,45 | 0,93 | 0,7-0,99 | 4,00 | 0,00 | 1,00 | 0,8-1 | 3,60 | 0,55 | 0,87 | 0,62-0,96 |
Ítem 18 | 4,00 | 0,00 | 1,00 | 0,8-1 | 4,00 | 0,00 | 1,00 | 0,8-1 | 3,80 | 0,45 | 0,93 | 0,7-0,99 |
Ítem 19 | 4,00 | 0,00 | 1,00 | 0,8-1 | 4,00 | 0,00 | 1,00 | 0,8-1 | 3,80 | 0,45 | 0,93 | 0,7-0,99 |
Ítem 20 | 3,80 | 0,45 | 0,93 | 0,7-0,99 | 4,00 | 0,00 | 1,00 | 0,8-1 | 3,80 | 0,45 | 0,93 | 0,7-0,99 |
Análisis factorial exploratorio (AFE) en la submuestra 1
La prueba de Kaiser-Meyer-Olkin (KMO) fue adecuada (KMO = 0,965) y la esfericidad se probó significativamente (p<0,001), esto indica que la muestra es apta para realizar un análisis factorial. Primero, se realizó un AFE con factorización del eje principal y rotación promax en la submuestra 1 (n=257). Según este análisis, tres factores (dimensiones) tienen valores propios mayores que uno o próximos a él; por lo tanto, se retienen tres factores para la escala, y estos tres factores explican el 68,492 % de la varianza. La Tabla 3 presenta las cargas factoriales y las comunalidades.
Este análisis permite identificar cuáles ítem corresponden a qué dimensión (factor). También permite identificar cuáles son los ítems que no tienen suficiente carga factorial o no tienen un alto nivel de comunalidad. Por valores menos a 0,4 o cercanos a estos, se eliminan los ítems 8, 10 y 17. Por la baja comunalidad se elimina el ítem 1. La versión que va a análisis factorial confirmatorio es de una encuesta con 16 ítems.
Ítem | Factor 1 | Factor 2 | Factor 3 | Comunalidad |
---|---|---|---|---|
Ítem 1 | 0,665 | 0,483 | ||
Ítem 2 | 0,650 | 0,698 | ||
Ítem 3 | 0,644 | 0,592 | ||
Ítem 4 | 0,564 | 0,710 | ||
Ítem 5 | 0,632 | 0,687 | ||
Ítem 6 | 0,723 | 0,614 | ||
Ítem 7 | 0,839 | 0,676 | ||
Ítem 8 | 0,351 | 0,568 | ||
Ítem 9 | 0,657 | 0,594 | ||
Ítem 10 | 0,391 | 0,705 | ||
Ítem 11 | 0,640 | 0,701 | ||
Ítem 12 | 0,899 | 0,822 | ||
Ítem 13 | 0,686 | 0,707 | ||
Ítem 14 | 0,666 | 0,677 | ||
Ítem 15 | 0,544 | 0,695 | ||
Ítem 16 | 0,501 | 0,667 | ||
Ítem 17 | 0,484 | 0,793 | ||
Ítem 18 | 0,606 | 0,739 | ||
Ítem 19 | 0,873 | 0,775 | ||
Ítem 20 | 0,787 | 0,795 |
Análisis factorial confirmatorio (AFC) en la submuestra 2
Este modelo de tres factores se evalúa utilizando AFC en la submuestra 2 (n=2361). El ajuste del modelo es bueno según todos los índices de ajuste (SB χ2=1091,8, gl =101, p<0,001; RMSEA=0,064; SRMSR=0,023; CFI=0,971, NFI= 0,968, TLI= 0,965). Además, todos los ítems tienen cargas factoriales estandarizadas superiores a 0,40 (p<0,001) (Tabla 4). La pertenencia a cada ítem se visualiza en el Gráfico 1.
Factor | Ítem | Cargas factoriales |
---|---|---|
Factor 1: | Ítem 6 | 0.821 |
Innovación y Colaboración en Salud Pública | Ítem 9 | 0.898 |
Ítem 14 | 0.932 | |
Ítem 16 | 0.909 | |
Ítem 18 | 0.926 | |
Ítem 19 | 0.916 | |
Factor 2: | Ítem 20 | 0.914 |
Gestión y Eficiencia en Salud Pública | Ítem 7 | 0.772 |
Ítem 11 | 0.881 | |
Ítem 12 | 0.871 | |
Ítem 13 | 0.856 | |
Factor 3: | Ítem 15 | 0.888 |
Planificación y Participación en Salud Pública | Ítem 2 | 0.809 |
Ítem 3 | 0.795 | |
Ítem 4 | 0.878 | |
Ítem 5 | 0.866 |
Estos valores de índices muestran que la escala es válida y presenta buenas propiedades psicométricas para el modelo de tres factores (dimensiones). Ahora la encuesta puede ser analizada para obtener los valores de fiabilidad (consistencia interna) con el cálculo de alfa de Cronbach y omega de McDonald.
Análisis de fiabilidad de la escala
El punto de corte para ambos valores de fiabilidad es 0,7. Se precia que los tres factores o dimensiones presentan valores óptimos tanto de alfa de Cronbach como de omega de McDonald. Así mismo la escala completa de 16 ítems muestra valores óptimos, esto quiere decir que la consistencia interna de la escala es óptima (Tabla 5).
Escala o Factor | Omega | Alfa |
---|---|---|
Factor 1: Innovación y Colaboración en Salud Pública | 0,935 | 0,934 |
Factor 2: Gestión y Eficiencia en Salud Pública | 0,927 | 0,926 |
Factor 3: Planificación y Participación en Salud Pública | 0,892 | 0,893 |
Escala total | 0,969 | 0,966 |
Se propone un instrumento validado de 16 ítems. Para establecer un punto de corte entre lo que se espera que sea una gestión en salud pública óptima se utiliza el concepto de percentil 90. Los posibles valores de la sumatoria de los ítems de este instrumento van de 16 a 80 puntos. El percentil 90 es 49 puntos. Esto indica que puntajes ≥ 49 indican buena gestión en salud pública. El 89,61 % de los participantes siente que la gestión de salud pública no es óptima según el punto de corte propuesto para la escala.
DISCUSIÓN
Los indicadores de gestión de la salud pública son de utilidad para evaluar la eficacia y eficiencia de los sistemas de salud pública a nivel mundial. Varios estudios han investigado la medición de indicadores de gestión en salud pública para respaldar la formulación de políticas basadas en evidencia y mejorar las prácticas de gestión de residuos sanitarios. Se destaca la importancia de las prácticas de gestión de residuos sanitarios en los hospitales, enfatizando la importancia de una gestión eficiente de los residuos para reducir los riesgos ambientales y para la salud12. Esto nos indica la gran complejidad y diversidad en cuento a dimensiones que deben tomarse en cuenta para estudiar un constructo de “calidad de atención” en el sector público.
Esta investigación contribuye con un instrumento validado sólidamente con fuertes principios estadísticos que hacen a un constructo sólido que puede ser utilizado para diferentes sectores en el sistema de salud pública. Podría ser de utilidad para un análisis situacional de cada hospital de la red pública y así tomar decisiones basadas en evidencia. Al ser una herramienta cuantitativa, también podría realizarse comparaciones antes y después de algún tipo de invervención. De manera similar, se validó la versión en mandarín de un cuestionario de alfabetización en salud bucal en Taiwán, utilizando pruebas psicométricas y métodos de evaluación13. Esta investigación muestra la aplicación de principios psicométricos en la adaptación y validación de instrumentos para poblaciones específicas y patologías específicas.
En una investigación similar sobre la evaluación de disponibilidad y preparación de servicios de salud en el primer nivel de atención de cinco regiones sanitarias del Paraguay durante se evaluó la disponibilidad y preparación de servicios de salud en las Unidades de Salud Familiar (USF) en cinco regiones sanitarias. Los resultados revelaron que la mayoría de las USF estudiadas no estaban completamente preparadas para brindar servicios integrales de salud a sus comunidades14. Este tipo de investigaciones demuestra la importancia de este tipo de instrumentos.
También internacionalmente se han realizado publicaciones que intentan utilizar un instrumento para cuantificar de alguna manera la atención brindada en centros asistenciales del sistema público, en una investigación titulada “Instrumentos que valoran las funciones de la atención primaria de salud: perspectiva de los usuarios”15 se examinan cuestionarios desarrollados y validados para evaluar las funciones de la atención primaria de salud (APS) desde la perspectiva de los usuarios. Esta investigación destaca que el 86 % de los estudios analizados fueron descriptivos y de validación de instrumentos, mientras que el 14 % restante fueron descriptivos, de adaptación transcultural y de validación de instrumentos. El estudio proporciona una visión detallada de los cuestionarios desarrollados y validados para evaluar las funciones de la APS. Esto demuestra el interés que existe en validar instrumentos en salud pública a nivel internacional, es por ello por lo que esta investigación contribuye bastante a nuestro contexto nacional y a futuras investigaciones similares15-17.
CONCLUSIÓN
Todos los procesos de validación tienen éxito, en primer lugar, la validación por expertos presenta buenos valores de V de Aiken. El análisis factorial exploratorio descarta cuatro ítems por tener poco respaldo estadístico. El análisis factorial confirmatorio demuestra el éxito de los factores o dimensiones encontradas en el análisis factorial exploratorio. Así mismo, los valores de consistencia interna son óptimos. Se propone un punto de corte para verificar los resultados de la encuesta propuesta.