Introducción
La investigación médica se lleva a cabo para aumentar los conocimientos sobre la especie humana (y sobre su entorno social/natural) y de esa manera combatir las enfermedades que afectan a los seres humanos1 y mejorar su calidad de vida. En Medicina, la investigación se clasifica en primaria y secundaria. Los estudios clínicos, tanto experimentales como observacionales, se realizan en la investigación primaria, mientras que la investigación secundaria consolida los estudios disponibles en forma de revisiones sistemáticas y metaanálisis. Mientras que la investigación primaria implica la participación activa del propio investigador, la investigación secundaria consiste en la síntesis y el análisis de los resultados, organizados y publicados por otros, como investigaciones primarias. Entonces, podría decirse que la investigación secundaria resume y analiza los estudios disponibles, cuyos resultados son fruto de la investigación primaria2. Tomando en cuenta lo anterior, este artículo de revisión tratará sobre aspectos del diseño de investigaciones primarias, desde el paradigma cuantitativo. Asimismo, se presenta una propuesta de algoritmo de clasificación.
Al realizar una investigación primaria, el investigador recopila información de primera mano en lugar de basarse en la información disponible en bases de datos y otras publicaciones. Este tipo de investigación se lleva a cabo con el objetivo de producir nuevos conocimientos, razón por la cual la investigación primaria también se denomina investigación original. Al realizar una investigación primaria, los investigadores pretenden responder a preguntas que no han sido contestadas o ni siquiera planteadas antes. Este grado de originalidad diferencia la investigación primaria de la secundaria3.
La investigación primaria puede realizarse de diversas maneras, siempre basándose en los principios del método científico4. La calidad, fiabilidad y posibilidad de publicar una investigación primaria dependen decisivamente de la selección de un diseño de investigación adecuado. Este diseño de investigación viene determinado por la pregunta a la que se quiere dar respuesta y decide la utilidad de un estudio científico y su capacidad de interpretación, por lo que, si se selecciona un diseño incorrecto, ya no podrá rectificarse una vez iniciado el estudio.
A través de este artículo se abordará la clasificación de los distintos tipos de diseño de investigación primaria. Se ilustran con ejemplos el concepto, los aspectos metodológicos y las ventajas y limitaciones, así como las posibilidades de uso de los distintos tipos de diseño. Este artículo se basa en una revisión bibliográfica selectiva, así como en la propia experiencia de los autores.
ALGORITMO DE CLASIFICACIÓN DE LOS TIPOS DE DISEÑO DE INVESTIGACIÓN PRIMARIA: NUESTRA PROPUESTA
Existen varios tipos de diseño de investigación, cada uno con sus ventajas y limitaciones. El tipo de diseño utilizado sirve para responder a una pregunta de investigación concreta, viene determinado por la naturaleza de esta, por el objetivo de la investigación y por la disponibilidad de recursos5. Se entiende por “diseño de investigación” al conjunto de métodos y procedimientos utilizados para recopilar y analizar datos sobre variables especificadas en una determinada pregunta de investigación5. Dado que el tipo de diseño puede afectar la validez de los resultados de una investigación, se hace mandatorio conocer las principales características de los más utilizados en las ciencias biomédicas.
Se ha afirmado que, como en la biología, en la investigación primaria existen también la anatomía y la fisiología 6. La primera dirige la segunda. En este sentido, la “anatomía” de un estudio (el tipo de diseño de investigación) determina lo que este puede y no puede hacer (su “fisiología”). Asimismo, y del mismo modo que la biología tiene al reino animal y al vegetal, la investigación primaria tiene sus propios dos grandes reinos: el experimental y el observacional, tal como se observa en nuestra propuesta de algoritmo de clasificación (Figura 1), que ha sido adaptada de un modelo previo de Grimes y Schulz6.
Lo primero que debe hacer un investigador para ubicar al tipo de diseño de investigación en uno de los dos reinos es determinar si este involucra la intervención sobre las variables en estudio (la asignación de las exposiciones) o si simplemente se las observa, sin realizar intervenciones sobre estas7,8.
En los estudios experimentales, el investigador interfiere activamente con la naturaleza (realizando una intervención en las variables o en los participantes del estudio, en algunos o en todos) para determinar el efecto de la exposición a esa intervención en el curso natural de los acontecimientos9. Como se observa en la Figura 1, para nombrar correctamente a los estudios experimentales, el investigador debe distinguir si las exposiciones se asignaron mediante una técnica aleatoria o no10. Se espera que un procedimiento de aleatorización bien aplicado dé como resultado dos grupos que sean comparables en general, tomando en cuenta tanto los factores medidos como aquellos que no. Así pues, teóricamente, los dos grupos solo difieren en la intervención recibida, y cualquier diferencia en los resultados entre ellos está relacionada con el efecto de la intervención. Esto es lo que se busca con los llamados ensayos clínicos controlados aleatorizados9. Se presentarán ejemplos de estudios experimentales más adelante en este artículo.
Por el contrario, en los estudios observacionales el investigador se limita a documentar la presencia de exposición(es) y resultado(s) tal y como se producen, sin intentar alterar el curso de los acontecimientos naturales. Los estudios observacionales son los más frecuentemente utilizados en la investigación biomédica y, tal como se observa en la Figura 1, pueden dividirse según cuenten o no con un grupo de comparación o control. En caso afirmativo, el estudio se denomina analítico11. En caso contrario, se trata de un estudio descriptivo12.
Si el estudio es analítico, es necesario identificar el sentido de la investigación7 (Figura 1). Si el estudio comienza con una exposición (por ejemplo, la infección por COVID-19) y sigue a los participantes durante un tiempo para medir el resultado (por ejemplo, desarrollo de síntomas de depresión o ansiedad), entonces se considera un estudio de cohortes. Los estudios de cohortes pueden ser prospectivos (el resultado aún no se dio, se lo espera en un futuro) o retrospectivos (el resultado ya está a la vista, en el presente), pero siempre se parte de la exposición al factor de estudio y lo que se está investigando es el desenlace de esa exposición. Por el contrario, si el estudio analítico comienza con un resultado (por ejemplo, depresión o ansiedad) y se remonta en el tiempo a una exposición (infección por COVID-19), entonces la investigación es un estudio de casos y controles11. Daremos ejemplos de todo esto más adelante.
Por último, un estudio descriptivo se utiliza para describir la distribución o características de una o más variables y, también, permite describir la asociación entre dos o más variables, pero sin asumir una relación causal entre ellas12. Los estudios descriptivos pueden ser de varios tipos (Figura 1): estudios de prevalencia y asociación cruzada, estudios ecológicos, series de casos, evaluación de pruebas diagnósticas y estudios de concordancia. En las siguientes secciones de este artículo se harán las diferenciaciones de cada uno de estos tipos de estudios.
Nuestro algoritmo permite clasificar a los tipos de diseño de investigación en dos grandes grupos: 1. según exista o no asignación de las exposiciones (intervención sobre las variables): estudio experimental u observacional; y, 2. para el caso específico de los estudios observacionales, según la finalidad del estudio: investigación analítica o descriptiva. Además de estas clasificaciones, existen al menos dos maneras más de catalogar a los tipos de diseño de investigación13. La Figura 2 resume estas clasificaciones. Cada una de estas clasificaciones y los tipos de diseño que las integran, se comentarán en las secciones siguientes de este artículo.
CLASIFICACIÓN SEGÚN EXISTA O NO ASIGNACIÓN DE LAS EXPOSICIONES
Según este criterio, y como se adelantó previamente, los estudios pueden ser experimentales u observacionales (Figura 1 y Figura 2).
Estudios experimentales
Los estudios experimentales son aquellos en los que el investigador asigna el factor de estudio (interviene sobre las variables) y lo controla de forma intencional para los fines de su investigación. Los estudios experimentales son analíticos (ya que se centran en una relación causa-efecto), longitudinales y prospectivos (estas últimas características se analizarán más adelante en este artículo) y suelen valorar el efecto de una intervención (terapéutica, preventiva, otras) comparándola con otra, o con un grupo en el que esta no se ha realizado (grupo control)8.
Las intervenciones pueden ser muy variadas: la administración de un medicamento o vacuna o de un suplemento dietético, la realización de un procedimiento diagnóstico o terapéutico y la introducción de una herramienta educativa. Dependiendo de si la intervención está dirigida a prevenir la aparición de una enfermedad (por ejemplo, la administración de una vacuna, higiene de los alimentos a consumir, la distribución de preservativos o de un folleto educativo) o a aliviar o curar a personas con una enfermedad ya establecida (por ejemplo, los fármacos antirretrovirales en personas que viven con el VIH), un estudio experimental puede también denominarse “preventivo” o “terapéutico”, según sea el caso9. Según si las exposiciones/intervenciones se han asignado de manera aleatoria, los estudios experimentales pueden ser de dos grandes tipos: ensayo clínico controlado aleatorizado o ensayo clínico controlado no aleatorizado.
Ensayo clínico controlado aleatorizado
Un ensayo clínico controlado aleatorizado es el único tipo de diseño de investigación conocido que tiene la capacidad de evitar sesgos de selección y confusión en la investigación clínica 14. En este tipo de estudio, un grupo de participantes que cumple determinados criterios de inclusión y exclusión se asigna “aleatoriamente” a dos grupos distintos, cada uno de los cuales recibe una intervención diferente. La asignación aleatoria implica que cada participante tiene las mismas posibilidades de ser asignado a cualquiera de los dos grupos. El uso de la aleatorización es una de las principales características distintivas y uno de los puntos fuertes de este diseño de estudio. Como se mencionó previamente, se espera que un procedimiento de aleatorización bien aplicado permita la obtención de dos grupos que sean comparables y que solo se distingan en la intervención recibida, por lo que cualquier diferencia en los resultados puede afirmarse que está relacionada con el efecto de la intervención9,15.
Aspectos metodológicos
El término “controlado” se refiere a la presencia de un grupo de control o de comparación concurrente. Estos estudios tienen dos o más grupos: de intervención (o tratamiento) y de control. El grupo de control puede: 1. no recibir ninguna intervención; 2. recibir una intervención que se asemeja en algunos aspectos a la intervención que se está investigando, pero carece de actividad (por ejemplo, placebo o procedimiento simulado, también denominados ensayos “controlados con placebo” o “controlados con simulacro”); y, 3. recibir un control activo (por ejemplo, un tratamiento estándar ya aprobado, también denominado ensayo “controlado activamente”). A menudo se añaden algunas características metodológicas adicionales a este diseño de estudio, para mejorar aún más su validez. Entre ellas se incluyen, el enmascaramiento de la asignación, el cegamiento, la medición del cumplimiento, la minimización de los abandonos y la garantía de un tamaño adecuado de la muestra. Un ejemplo de un ensayo clínico aleatorizado controlado activamente es el publicado por Torales et al., que trató sobre la evaluación de la seguridad e inmunogenicidad de una vacuna candidata contra la COVID-19 (vacuna MVC-COV1901, como la intervención) frente a la vacuna AZD1222 (vacuna Oxford-AstraZeneca, ya utilizada como tratamiento aprobado, como el control activo)16. Este fue un ensayo clínico, de grupos paralelos, aleatorizado, doble ciego y controlado activamente, que se llevó a cabo en 2 centros sanitarios de Paraguay. Se asignaron al azar 1030 adultos (18-91 años), en una proporción 1:1, para recibir dosis intramusculares de la vacuna MVC-COV1901 o de la vacuna AZD1222, administradas según lo programado en el ensayo clínico. Se recogieron muestras de suero el día de la vacunación y 14 días después de la segunda dosis. Se evaluaron los criterios de seguridad e inmunogenicidad. Además, otros resultados investigados fueron la inducción de subclases de anticuerpos IgG. Entre los participantes, el 58 % eran seropositivos para COVID-19 al inicio del estudio. Cuando se comparó con la vacuna AZD1222, la vacuna MVC-COV1901 mostró superioridad en términos de títulos de anticuerpos neutralizantes y no inferioridad en términos de tasas de seroconversión. La reactogenicidad fue en general leve y no se produjo ningún acontecimiento adverso grave atribuible a la vacuna MVC-COV1901. Ambas vacunas mostraron una respuesta con sesgo Th1, predominada por la producción de las subclases de anticuerpos IgG1 e IgG3. Los investigadores concluyeron que la vacuna MVC-COV1901 era superior a la vacuna AZD1222 en términos de inmunogenicidad y era, además, segura y tolerable16.
Ventajas y limitaciones
El sello distintivo de los ensayos clínicos controlados aleatorizados es que el azar es el que determina la asignación de los participantes a los grupos de intervención o de control (y, por ende, a las exposiciones). Son diseños de investigación fuertes para evaluar la efectividad de una intervención y, además, permiten estudiar equivalencia terapéutica, bioequivalencia, biodisponibilidad, entre otros. Asimismo, permiten conocer el tamaño del efecto de las intervenciones en estudio17. Los ensayos clínicos controlados aleatorizados reducen la probabilidad de sesgo en la determinación de los resultados: 1. mediante la asignación aleatorizada se reduce el sesgo de selección (error sistemático que resulta del procedimiento empleado para seleccionar los sujetos y de los factores que influyen en la participación de un estudio)18; 2. el cegamiento de los participantes en cuanto a la exposición que recibe cada uno reduce el sesgo de información (que ocurre cuando la información sobre la enfermedad o la exposición se recoge de forma sistemáticamente diferente entre los grupos de estudio y supone una mala clasificación de los sujetos, respecto a la exposición o intervención, o bien respecto a la enfermedad o variable de respuesta19; y, 3. su diseño único facilita la eliminación del sesgo de confusión (en este tipo de sesgo, una variable de confusión, también llamado confusor o factor confusor, sesga una asociación cuando se relaciona tanto a la exposición como a la variable desenlace a la vez, creando una asociación falsa20.
No obstante, los ensayos clínicos controlados aleatorizados también tienen inconvenientes. Mientras que este tipo de diseño de investigación, si se realiza correctamente, tiene validez interna (es decir, mide lo que se propone medir), puede no tener validez externa. Este término indica hasta qué punto los resultados pueden generalizarse a la población. A diferencia de un estudio observacional, el ensayo clínico controlado aleatorizado solo incluye a voluntarios que pasan por un proceso de selección antes de ser incluidos, por lo que la población en estudio debe estar muy bien definida. Además, muchas veces, el tamaño de la muestra es difícil de obtener. Otras limitación viene dada por la adherencia de los participantes, puesto que la pérdida de estos durante el seguimiento pone en riesgo la validez del estudio18. Finalmente, el coste es un factor limitante, puesto que estos estudios pueden ascender a incluso decenas de millones de dólares.
Ensayo clínico controlado no aleatorizado
En un ensayo clínico controlado no aleatorizado (también denominado ensayo cuasiexperimental), los participantes del estudio no son asignados aleatoriamente a las exposiciones (terapéuticas o preventivas), sino que se asignan siguiendo la conveniencia del investigador o según las características particulares de los participantes. Es decir, existe un grupo de intervención y un grupo control, aunque los participantes de cada uno no han sido asignados aleatoriamente, por lo que los grupos podrían no ser comparables.
Aunque generalmente se considera que el ensayo clínico controlado aleatorizado tiene el mayor nivel de credibilidad en lo que respecta a la evaluación de la causalidad, los investigadores a menudo optan por no aleatorizar la intervención por una de las siguientes razones: 1. consideraciones éticas; 2. dificultad para aleatorizar a los sujetos; 3. dificultad para aleatorizar por sitios o lugares de investigación; y 4. pequeño tamaño de la muestra disponible (21.
Aspectos metodológicos
En un ensayo clínico controlado no aleatorizado, la comparación estadística se realiza entre los distintos brazos (grupo experimental y grupo control) del ensayo (como en un ensayo clínico controlado aleatorizado), pero la asignación del tratamiento o intervención no es aleatoria. La asignación la realiza el investigador o el ejecutor en función de la logística o las necesidades22,23. Estos estudios, por tanto, tienen la necesidad de demostrar que ambos grupos, el de intervención y el de control, son comparables. A diferencia de los ensayos clínicos controlados aleatorizados, los desequilibrios entre los grupos no se deben al azar hasta que se demuestre lo contrario (lo que suele ser imposible). En la mayoría de los casos, se utilizan características basales para ajustar los desequilibrios. Estas incluyen a las características demográficas y socioeconómicas (y otras covariables potencialmente asociadas con el resultado y la intervención), así como una medida basal del resultado de interés que se pretende medir. Entonces, conceptualmente, el resultado en el grupo de control se utiliza como aproximación para estimar el resultado en el grupo de intervención si no hubiera recibido la intervención (el resultado potencial)24.
Ensayo “antes-después” (“pre-post”)
Este es un diseño bastante frecuente y básicamente se trata de un ensayo cuasiexperimental sin grupo control (solo está presente el grupo de intervención). Este tipo estudio se basa en la medición y comparación de la variable respuesta, antes y después de la exposición del sujeto a la intervención (la exposición). En los estudios antes-después con un solo grupo, el investigador puede manipular la exposición, pero al no incluir un grupo de comparación, cada sujeto actúa como su propio control25. La no existencia de un grupo control hace que sea imposible asegurar que los cambios aparecidos (la respuesta) sean debidos a la intervención realizada por los investigadores, puesto que podrían deberse a otras intervenciones o factores no controlados.
Un ejemplo de ensayo “antes-después” fue el realizado por Almirón y Barrios26. En este estudio se valoró la funcionalidad de personas con lesiones del miembro superior, pre y post tratamiento kinésico, a través de la versión en español del cuestionario DASH (Disabilities of the arm, shoulder and hand). El DASH es un cuestionario autoadministrado que consta de un cuerpo central (que mide discapacidad/síntoma) de 30 ítems y 2 módulos opcionales, con 4 ítems cada uno. Cada ítem se puntúa de 1 a 5, con valores crecientes en función de la intensidad de los síntomas. En el caso de las preguntas de discapacidad/síntomas (30 preguntas, puntuación del 1-5), para poder calcular la puntuación hay que completar al menos 27 de las 30 preguntas. Se suman los valores asignados a cada una de las respuestas completadas y se halla el promedio, obteniendo así una puntuación del uno al cinco. Para expresar esta puntuación en por cientos, se le resta 1 y se multiplica por 25. A mayor puntuación, mayor discapacidad. Los módulos opcionales, en su caso, se puntúan por separado siguiendo el mismo método27. Fueron incluidos 20 pacientes en la investigación (55 % del sexo masculino). Al inicio de la investigación, la puntuación del DASH fluctúo entre 6,7 y 73,6 puntos, con una media de 33 ± 22,1 puntos. Después del tratamiento kinésico aplicado, los puntajes oscilaron entre 1,7 y 55, con una media de 17,8 ± 14,6 puntos. Los investigadores concluyeron que el tratamiento aplicado (la intervención) fue efectiva para mejorar la funcionalidad de personas con lesiones del miembro superior.
Ventajas y limitaciones
Aunque los ensayos clínicos controlados no aleatorizados pueden sugerir una posible relación entre la intervención y el resultado, tienen menor rigor científico que los ensayos clínicos controlados aleatorizados6) al ser susceptibles de sesgo; no obstante, siguen siendo superior a los estudios observacionales analíticos.
La principal ventaja de los ensayos cuasiexperimentales es que son un alternativa cuando no es posible aleatorizar una intervención o cuando no es posible tener un grupo control. Su principal limitación radica en que no se puede asegurar que los resultados obtenidos son consecuencia de la propia intervención, de otras intervenciones o de factores no controlados25. Además, sobre todo en ensayos “antes-después”, existe la posibilidad de que la validez del estudio se vea comprometida por la aparición del efecto Hawthorne, el efecto placebo, la regresión a la media y el no control de la evolución natural de la enfermedad (Figura 3).
Estudios observacionales
Los estudios observacionales, aquellos en los que no existe intervención sobre las variables en estudio, se analizarán en la siguiente sección, considerando que uno de los criterios de clasificación de los tipos de diseño de investigación, la finalidad analítica o descriptiva, se aplica exclusivamente a ellos.
CLASIFICACIÓN SEGÚN FINALIDAD (ESTUDIOS OBSERVACIONALES): ANALÍTICA O DESCRIPTIVA
Los estudios observacionales son los más frecuentemente utilizados en la investigación biomédica. En ellos, el investigador se limita a documentar la presencia de exposición(es) y resultado(s) tal y como se producen, sin intentar alterar el curso de los acontecimientos naturales (no asignado exposiciones o intervenciones). Según exista o no comparación de grupos, los estudios observacionales pueden ser analíticos (hay comparación de grupos) o descriptivos (no hay comparación) (Figura 1).
Estudios analíticos
En los estudios analíticos observacionales, los investigadores intentan establecer una asociación entre exposición(es) y resultado(s). Un estudio se considera analítico cuando su finalidad es evaluar una presunta relación causal entre un factor (por ejemplo, un agente que se sospecha que puede causar una enfermedad o un tratamiento que puede prevenir o mejorar una situación clínica) y un efecto, respuesta, resultado o evento de interés. Dependiendo del sentido o dirección de la investigación, estos estudios pueden dirigirse de la exposición al resultado (estudios de cohortes) o viceversa (estudios de casos y controles). Cabe destacar que, en los estudios analíticos observacionales, la exposición se determina de forma natural, a diferencia de los estudios experimentales en los que un investigador asigna a cada sujeto recibir o no una exposición o intervención determinada11.
Estudio de cohortes
El término cohorte se utiliza para designar a un grupo de sujetos que tiene una característica o un conjunto de características en común (generalmente la exposición al factor de estudio), y que son seguidos en el transcurso del tiempo para evaluar la aparición de un resultado. Un estudio de cohortes es, por tanto, un diseño observacional analítico longitudinal en el que se comparan dos cohortes, o dos grupos dentro de una misma cohorte, que difieren por su exposición al factor de estudio, con el objetivo de evaluar una posible relación causa-efecto 28. Los participantes tienen que estar libres del resultado o evento de interés al inicio del estudio. Se registra la presencia o ausencia del factor de riesgo (exposición) en cada sujeto. A continuación, se realiza un seguimiento de los sujetos a lo largo del tiempo (longitudinalmente) para determinar la aparición del resultado. Así pues, en los estudios de cohortes el sentido de la investigación va de la exposición al desenlace y suelen ser estudios prospectivos (el desenlace no se ha producido al inicio del estudio), aunque también pueden ser retrospectivos (véase más adelante) (5,7,11. La Figura 4 resume la estructura básica de un estudio de cohortes.
Aspectos metodológicos
La selección correcta de las cohortes es fundamental para garantizar un adecuado enfoque metodológico. Las cohortes deben seleccionarse con base en la presencia o ausencia de la exposición al factor que presumimos es de riesgo para el desarrollo de la respuesta (enfermedad o evento de interés)17. Dado que son estudios analíticos (estudian una presunta relación causa-efecto), la consideración más importante es la comparabilidad de las cohortes expuesta y no expuesta, así como asegurar que se dispone del número suficiente de sujetos con las características predictoras más importantes y de desenlaces observados durante el estudio, con el fin de permitir un análisis válido13. En el caso de exposiciones frecuentes (por ejemplo, a los virus respiratorios invernales), los individuos expuestos pueden seleccionarse de la población general. Por su parte, para exposiciones poco frecuentes (factores ocupacionales, por ejemplo, el ambiente laboral de una unidad de emergencias médicas de un hospital general), los sujetos expuestos deben seleccionarse a partir de grupos especiales de la población (por ejemplo, médicos de urgencias), de esta forma la medida de exposición será más exacta. La población no expuesta debe ser similar al grupo expuesto en todos los factores posibles relacionados al resultado, excepto en el factor de exposición a evaluar; por lo tanto, la recolección de información debe ser comparable a la del grupo expuesto. En el ejemplo de médicos expuestos al ambiente laboral de una unidad de emergencias médicas, se utilizaría como población no expuesta a la conformada por médicos que no forman parte de la unidad antedicha, sino que prestan servicios en consulta externa o atención primaria del mismo hospital29.
Para verificar el desarrollo de la respuesta, enfermedad o la aparición del evento que se está investigando, todos los sujetos elegibles deben ser monitoreados durante una cantidad de tiempo especificada. Es importante tener en cuenta de dónde provienen los datos de la exposición. Estos nos brindan un cierto nivel de seguridad de que los resultados serán comparables para todos los participantes, nos permiten categorizar al sujeto como expuesto o no expuesto y brindan información demográfica e información sobre posibles factores de confusión. Se debe tener en cuenta la posibilidad de que los niveles de exposición cambien durante el seguimiento. Aquí se debe destacar que el mayor desafío de un estudio de cohortes es el seguimiento de un elevado número de sujetos durante un período prolongado de tiempo, por lo que la mayoría de los esfuerzos se dedican a asegurarlo. Los investigadores deben recoger información sobre los cambios que se presentan en los factores de riesgo y las variables pronósticas, así como registrar si alguno de los participantes ha desarrollado el desenlace de interés. Se destaca que el tiempo dedicado al seguimiento dependerá del período de latencia entre la exposición y el resultado o evento de interés30).
Según la relación cronológica entre el inicio del estudio y el desarrollo de la respuesta o evento que se está investigando, los estudios de cohortes se pueden clasificar en prospectivos o retrospectivos.
En un estudio de cohorte prospectiva (también llamado concurrente), el sentido de la investigación va del presente al futuro. El investigador parte de la formación de los grupos de sujetos expuestos y no expuestos a un posible factor de riesgo, y los sigue durante un tiempo para determinar las tasas de incidencia del resultado en ambos grupos. Este tipo de estudio de cohortes es útil para determinar la incidencia del desenlace en los sujetos expuestos y no expuestos y el riesgo relativo como medida de magnitud de asociación entre el factor de riesgo y la variable resultado. Un estudio de cohorte prospectiva podría llegar a ser erróneamente etiquetado como un ensayo clínico controlado no aleatorizado. No obstante, la Figura 1 nos recuerda que en los estudios experimentales siempre existe intervención sobre las variables en estudio, mientras que en los observacionales (como es el caso de los estudios de cohortes), el investigador se limita a documentar la presencia de exposición(es) y resultado(s) tal y como se producen, sin intentar alterar el curso de los acontecimientos naturales30,31.
Un ejemplo de estudio de cohorte prospectiva fue el realizado por Ismael et al., que investigaron la relación entre la cantidad de síntomas que presentaban personas con COVID-19 leve y el desarrollo de síntomas depresivos, de ansiedad y de estrés postraumático32. Este fue un estudio de cohortes prospectivo, donde los frotis nasofaríngeos para las pruebas de detección de COVID-19 se recogieron en los domicilios de los pacientes, bajo la supervisión de personal sanitario. Los pacientes que dieron positivo en las pruebas de COVID-19 y fueron clasificados como casos leves en el momento del ingreso al estudio (N = 895), fueron evaluados posteriormente para determinar la presencia de síntomas psiquiátricos (una media de 56,6 días después de la admisión al estudio). Con base en la cantidad de síntomas de COVID-19, los participantes se dividieron en grupos (asintomáticos y 1 o más síntomas). Se investigó la asociación entre el número de síntomas y el desarrollo de síntomas depresivos, de ansiedad y de estrés postraumático aproximadamente dos meses más tarde. Se emplearon modelos de regresión logística multivariante y modelos lineales generalizados para los resultados de variables categóricas y continuas, respectivamente.
El 26,2 % (n = 235), el 22,4 % (n = 201) y el 17,3 % (n = 155) de la muestra declararon un nivel clínicamente significativo de síntomas depresivos, de ansiedad y de estrés postraumático, respectivamente. La exposición (cantidad de síntomas de COVID-19) se asoció significativamente con todos los resultados, tras ajustar los factores de confusión (por ejemplo, el estado de salud mental previo). Por cada aumento en un síntoma de COVID-19, la probabilidad de desarrollar niveles clínicamente significativos de depresión, ansiedad o estrés postraumático aumentó aproximadamente un 6 %, 7 % y 9 %, respectivamente. El hecho de reportar un mayor número de síntomas de COVID-19 se asoció con la presencia de niveles clínicamente significativos de depresión (aOR = 1,059; 95 %CI = 1,002-1,119), ansiedad (aOR = 1,072; 95 %CI = 1,012-1,134), y síntomas de estrés postraumático (aOR = 1,092; 95 %CI = 1,024-1,166). Los análisis de sensibilidad corroboraron los resultados de las medidas continuas y categóricas. Con base en estos resultados, los autores concluyeron que la exposición a un mayor número de síntomas de COVID-19 está asociada a síntomas aumentados de depresión, de ansiedad y de estrés postraumático tras la fase aguda de la infección32.
Por su parte, en un estudio de cohorte retrospectiva (o histórica) tanto la exposición como la enfermedad ya han ocurrido cuando se lleva a cabo el estudio. Aquí el sentido de la investigación va del pasado al presente. La identificación de las cohortes expuesta y no expuesta se basa en su situación en una fecha previa bien definida y suficientemente lejos en el tiempo para que el evento que se está investigando haya tenido tiempo de desarrollarse, y se determina en cuántos sujetos este se ha presentado. Los estudios de cohorte histórica son más rápidos y económicos que las cohortes prospectivas, pero requieren para su ejecución que las fuentes de información sean adecuadas y completas, lo que asegura que todos los sujetos en estudio sean comparables.
Los estudios de cohorte retrospectiva son de gran utilidad si los periodos de latencia entre la exposición y el desarrollo del evento que se está investigando son prolongados33,34. Un estudio de cohorte retrospectiva puede confundirse con un estudio de casos y controles: la diferenciación se hace tomando en consideración desde donde parte la investigación: de la exposición buscando el resultado (estudio de cohortes) o del resultado buscando la exposición (estudio de casos y controles).
Un ejemplo de estudio de cohorte retrospectiva fue el realizado por Sequera et al., que investigaron cómo el aumento de las tasas de encarcelamiento hace crecer la carga de tuberculosis en las prisiones y pone en peligro el control general de la tuberculosis en Paraguay35. Los autores de este estudio describieron la carga y las tendencias de la tuberculosis entre la población privada de libertad de Paraguay a lo largo del tiempo, así como sus diferencias clínicas y epidemiológicas y la fracción atribuible poblacional de tuberculosis penitenciaria en relación con la carga de tuberculosis en la población general del país. Se incluyó en el estudio a todos los casos de tuberculosis notificados al Programa Nacional de Control de la Tuberculosis de Paraguay durante el periodo 2009-2018. También se utilizaron registros de casos de personas privadas de libertad, con diagnóstico de tuberculosis, provenientes del Ministerio de Justicia. En este estudio, el factor de exposición fue el hecho de estar privado de libertad, mientras que el desarrollo de tuberculosis fue considerado como el resultado o desenlace.
Durante el período 2009-2018, 2764 (9,7 %) de los 28534 casos de tuberculosis notificados en Paraguay ocurrieron en cárceles. El número de personas privadas de libertad aumentó de 6258 en 2009 a 14627 en 2018 (tasa de encarcelamiento, 101 a 207 por 100 000), mientras que el número de casos de tuberculosis entre las personas privadas de libertad aumentó en un 250 % (n = 192 en 2009 frente a n = 480 en 2018). La tasa anual de notificación de tuberculosis entre las personas privadas de libertad de sexo masculino fue de 3218 y 3459 por cada 100000 reclusos en 2009 y 2018, respectivamente. El porcentaje de todos los casos de tuberculosis que ocurrieron entre los reclusos aumentó del 7,1 % en 2009 al 14,5 % en 2018. El riesgo relativo de tuberculosis en las cárceles en comparación con la comunidad fue de 70,3 (IC 95%, 67,7-73,1). Por su parte, el riesgo atribuible global de la población fue del 9,5 %. Los investigadores concluyeron que la epidemia de tuberculosis en las cárceles representa uno de los desafíos más importantes para el control de la enfermedad en Paraguay, por lo que recomendaron se establezcan medidas apropiadas de control de la tuberculosis entre las poblaciones privadas de libertad, habida cuenta de su impacto sustancial en la carga global de tuberculosis en el país35.
Una variante al diseño tradicional del estudio de cohortes es el estudio de casos y controles anidado en una cohorte. Este es un diseño compuesto en el que se agrega un estudio de “casos y controles” (véase más adelante en este artículo) mientras se monitorea una cohorte (típicamente prospectiva). Para realizar este estudio, se lleva a cabo una evaluación de todos los casos relacionados con el evento investigado y se eligen grupos de control sin este dentro de la misma cohorte. Su principal beneficio es que permite reducir costos y eventualmente el tiempo de seguimiento de un estudio de cohorte convencional 36.
Se define como cohorte bidireccional a aquella en la que los datos son recolectados tanto de forma prospectiva como retrospectiva (“ambispectiva”). Esta variante es de utilidad cuando la exposición en estudio tiene efectos tanto a corto como a largo plazo. Son especialmente útiles para estudiar exposiciones raras a factores ocupacionales o ambientales37. Se habla de cohorte fija cuando solo se incluyen los individuos que cumplen los criterios de inclusión en la fecha de inicio del estudio; mientras que una cohorte será dinámica cuando los individuos se van incluyendo a medida que progresa el estudio, es decir, a medida que se van identificando.
Los estudios de cohorte (así como los estudios experimentales) permiten el cálculo de la tasa de incidencia, el riesgo relativo (RR) y la Razón de Peligro o Hazard Ratio (RP o HR), así como también sirven para determinar el riesgo atribuible o la diferencia de riesgo, y el número necesario de tratar (NNT). En epidemiología, la tasa de incidencia (también denominada densidad de incidencia) expresa la ocurrencia de la enfermedad entre la población en relación con unidades de tiempo-persona, por lo que mide la velocidad de ocurrencia de la enfermedad. El RR (también llamado razón de riesgo) se refiere a la frecuencia de eventos que ocurren en el grupo expuesto dividido sobre la frecuencia de eventos en el grupo no expuesto. Si la frecuencia de eventos es la misma en ambos grupos, el riesgo será igual a la unidad, indicando que la asociación de eventos en ambos grupos es la misma. Por contraste, si el evento o desenlace es más frecuente en el grupo expuesto que en el no expuesto, la razón de riesgo será mayor a la unidad, esto implica que existe un aumento del riesgo asociado en el expuesto. Inversamente, si la frecuencia de eventos o enfermedad en el grupo expuesto es menor con relación al no expuesto el riesgo relativo será menor que la unidad, lo cual implica un efecto protector de la exposición. En otras palabras, el RR es definida como la razón de la incidencia de enfermedad en el grupo expuesto dividido por la incidencia de enfermedad en el grupo no expuesto38,39. El HR es una medida de la frecuencia con la que se produce un acontecimiento concreto en un grupo, en comparación con la frecuencia con la que se produce en otro grupo, a lo largo del tiempo. Se utiliza a menudo en ensayos clínicos para medir la supervivencia en cualquier momento de un grupo de pacientes que han recibido un tratamiento específico en comparación con un grupo control que ha recibido otro tratamiento o un placebo. El HR difiere del RR (y también del odds ratio [OR], véase más adelante) en que el RR y el OR son acumulativos a lo largo de todo un estudio, utilizando un criterio de valoración definido, mientras que el HR representan el riesgo instantáneo a lo largo del periodo de tiempo del estudio, o de algún subconjunto de este. La diferencia entre la tasa de incidencia de eventos en el grupo expuesto frente al grupo no expuesto es el riesgo atribuible. El NNT, por otro lado, se usa con frecuencia para presentar los hallazgos en ensayos clínicos aleatorios. Es el número de pacientes que deben ser tratados para evitar un evento adverso, muerte, enfermedad o recaída40.
Ventajas y limitaciones
Los estudios de cohorte tienen ventajas destacables. Los estudios de cohorte son bastante útiles
en la investigación de múltiples desenlaces que podrían producirse después de exponerse a un factor de exposición único. Ejemplo de esto es, como se ilustró previamente, la infección por COVI-19 (exposición) y el desarrollo de diferentes desenlaces (depresión, ansiedad, estrés postraumático)32. Además, aseguran una adecuada secuencia temporal, ya que se sigue a los sujetos desde la exposición hasta la aparición del efecto o desenlace. Esta característica también los diferencia de los estudios de casos y controles, en los que no siempre puede establecerse con seguridad una adecuada secuencia temporal. En los estudios de cohorte prospectiva se minimizan los errores en la medición de la exposición. Permiten calcular las tasas de incidencia y el riesgo relativo (a diferencia de los estudios de casos y controles, que solo permiten estimar el riesgo relativo de forma aproximada, pero no calcular las tasas de incidencia).
En cuanto a sus limitaciones, los estudios de cohorte no son útiles para el estudio de enfermedades poco frecuentes o con largo periodo de latencia. Asimismo, requieren un número elevado de participantes. Y, en el caso de cohortes prospectivas, estas suelen ser de larga duración y coste elevado7.
Estudio de casos y controles
Los estudios de casos y controles funcionan “al revés”. Como pensar en este sentido o dirección de la investigación es inusual para médicos y otros profesionales de la salud, estos estudios son frecuentemente malinterpretados. En los estudios de casos y controles se parte del resultado (del desenlace o del evento que se está investigando, como una enfermedad) y se busca en el pasado las exposiciones que podrían haber causado ese resultado. Como se muestra en la Figura 5, los investigadores definen un grupo que ya presenta un resultado o evento que se está investigando (estos serían los casos) y un grupo sin el resultado (los controles).
A continuación, mediante revisiones de historias clínicas, entrevistas u otros medios, los investigadores determinan la prevalencia de exposición a un factor de riesgo en ambos grupos y comparan ambos grupos respecto a la frecuencia de exposición previa a dicho factor de riesgo (factor de estudio) que se sospecha que está relacionado con el resultado. Si la prevalencia de la exposición es mayor entre los casos que entre los controles, entonces la exposición se asocia con un mayor riesgo de desarrollo del resultado o evento que se está investigando.
Un ejemplo un estudio de casos y controles es el publicado por investigadores y estudiantes de la Facultad de Ciencias Médicas de la Universidad Nacional de Asunción (Paraguay), sobre el hecho de ser bailarina como factor de riesgo para el desarrollo de insatisfacción corporal en mujeres 41. Ellos reclutaron casos de mujeres con insatisfacción corporal de academias de danza de la ciudad de Asunción (Paraguay) y las emparejaron con controles sanos de áreas vecinas. La frecuencia encontrada de insatisfacción corporal en bailarinas fue de 38,8 %. Los resultados obtenidos reportaron que las bailarinas tuvieron significativamente mayor probabilidad de tener insatisfacción con su imagen corporal que las no bailarinas (p=0,011), concluyéndose que el hecho de ser bailarina era un factor de riesgo para el desarrollo de insatisfacción corporal en mujeres jóvenes.
Aspectos metodológicos
Es crucial en este tipo de diseño de investigación asegurar una correcta definición y selección de los casos y controles, para garantizar la validez del estudio. Para identificar los casos deben establecerse, de forma clara y explícita, la definición del desenlace, resultado, enfermedad o evento que se está investigando, así como los criterios que deben cumplir aquellos que lo presenten para ser incluidos en el estudio. Por otro lado, la identificación de controles adecuados es necesaria puesto que puede influir en la estimación de la asociación entre la exposición y el resultado (generándose un sesgo de selección, lo que se discutirá más adelante). Los controles deben ser representativos de la población de la que se extrajeron los casos (por ejemplo, si los casos se extraen de una clínica comunitaria o una clínica ambulatoria, lo ideal sería que los controles también procedieran del mismo entorno)11.
A veces, los controles se emparejan individualmente con los casos para aquellos factores que se consideran importantes para el desarrollo del resultado (esto no se aplica para el factor de exposición). Entonces, para que el emparejamiento sea útil, debe realizarse por una variable que sea un potencial factor de confusión, es decir, relacionada tanto con el factor de estudio (exposición) como con la variable de respuesta (desenlace). Por ejemplo, en el estudio antes mencionado sobre insatisfacción corporal en bailarinas y no bailarinas41, los casos y los controles se emparejaron según edad, sexo e índice de masa corporal, reduciendo el riesgo de confusión. Además, para minimizar el sesgo de evaluación, es importante que la persona que valora los antecedentes de exposición (por ejemplo, ser bailarina en el estudio presentado) desconozca si el participante entrevistado es un caso o un control.
Con respecto a la cantidad de controles que debería seleccionarse por cada caso, cuando existe un número de casos suficiente se suele seleccionar un control por cada uno. Cuando el número de casos es limitado se recomienda seleccionar más de un control por caso, con el fin de aumentar la potencia estadística del estudio para detectar un efecto determinado. En general, con 3 controles por caso ya se tiene muy buena potencia estadística.
Como se mencionó previamente en la sección sobre estudios de cohortes, un variante especial de diseño es el estudio de casos y controles anidado en una cohorte. Aquí los participantes que desarrollan el resultado o desenlace (independientemente de si están expuestos o no) se eligen como “casos”. De entre el resto de los participantes del estudio que no han desarrollado el resultado, se selecciona un subconjunto de controles emparejados. A continuación, se comparan los casos y los controles con respecto a la exposición. Se trata de un estudio cuyo sentido va del resultado hacia la exposición. Su principal ventaja es que, como se sabe que el resultado no se había producido cuando se establecieron las cohortes, se garantiza la relación temporal entre la exposición y dicho resultado42. Este diseño supera algunas de las desventajas asociadas a los estudios de casos y controles, al tiempo que incorpora algunas de las ventajas de los estudios de cohortes. Más arriba ya se adelantó algo sobre el sesgo de selección. El sesgo de selección es especialmente preocupante en el estudio “clásico” de casos y controles y puede definirse como la diferencia sistemática entre los participantes del estudio y la población a la que pretenden representar con respecto a sus características, incluidas las demográficas y la morbilidad. Los casos y los controles suelen seleccionarse mediante muestreos de conveniencia. Por ejemplo, los casos suelen reclutarse en hospitales o consultorios porque resultan convenientes y de fácil acceso para los investigadores. Los controles suelen reclutarse en las mismas clínicas hospitalarias o consultorios que los casos. Por lo tanto, los casos seleccionados pueden no ser representativos de la totalidad de casos existentes en la población, así como los controles pueden no ser representativos de la población sana. Los estudio de casos y controles anidados en una cohorte minimizan el sesgo de selección puesto que aseguran que tanto casos y controles sean representativos de la población en estudio (la cohorte que los anida)43).
Otro sesgo al que se expone el estudio “clásico” de casos y controles es el sesgo de recuerdo, que reporta una diferencia sistemática entre casos y controles en la exactitud de la información recordada. El sesgo de recuerdo aparece si los participantes tienen ideas preconcebidas selectivas sobre la asociación entre la enfermedad o desenlace y la exposición pasada al factor o factores de riesgo. Por ejemplo, los casos pueden recordar la información con más precisión que los controles, posiblemente debido a su asociación con la enfermedad o el resultado. Aunque también, por definición, en los estudios de casos controles anidados en una cohorte los casos y los controles se identifican de forma retrospectiva, los datos se han recopilado de forma prospectiva (en la cohorte que los anida). Entonces, esto minimiza el riesgo de que se produzcan diferencias sistemáticas entre los grupos de participantes en el estudio en cuanto a la exactitud de la información recopilada44.
Dado que los estudios de casos y controles son retrospectivos, no existe un “grupo de riesgo” como tal al inicio del estudio; por lo tanto, no es posible determinar el “riesgo” (ni el riesgo relativo, mencionado previamente en la sección sobre estudios de cohortes), y solo se pueden estimar las “odds” (y el cociente de odds, odds ratio). El concepto de odds (también llamado “momio”) se da en el contexto anglosajón de las apuestas que se hacen en los juegos de azar y se trata de un cociente entre la probabilidad de que ocurra un evento determinado y la probabilidad de que no ocurra ese evento. Un odds ratio (OR) es la relación por cociente entre dos odds. El OR (razón de chance o ventaja o razón de productos cruzados), en estudios de casos y controles, se utiliza como medida de asociación, e indica el chance de exposición en el grupo de casos o con la enfermedad, dividido entre el chance de exposición en el grupo control40. Como se describe arriba, los sujetos son seleccionados sobre la base del estado de la enfermedad o resultado en el estudio de casos y controles, por lo tanto, no es posible calcular la frecuencia o tasa de desarrollo de esta, dada que no se conoce a priori la presencia o la ausencia de la exposición. Así el OR es a menudo usado como una aproximación del riesgo relativo en los estudios de casos y controles.
El OR es la proporción de chances de un acontecimiento en un grupo frente a las chances del acontecimiento en el otro grupo. El cálculo del riesgo requiere el uso de “personas en riesgo” como denominador. En los estudios retrospectivos (por ejemplo, estudio de casos y controles), en los que no se dispone del número total de personas expuestas, puesto que se parte del número de personas con el resultado o desenlace, no puede calcularse el RR y se utiliza el OR como medida de la fuerza de la asociación entre la exposición y el resultado. Por el contrario, en los estudios prospectivos (estudios experimentales y estudios de cohortes), en los que se dispone del número de personas en riesgo (número de personas expuestas), puede calcularse el RR (como se vio previamente) o el OR45. El OR se utiliza con mayor frecuencia en estudios de casos y controles, aunque también puede emplearse en estudios de prevalencia y de cohortes (con algunas modificaciones)46.
Ventajas y limitaciones
Los estudios de casos y controles son ideales para enfermedades raras, en las que es más fácil identificar casos que hacer un seguimiento de un gran número de personas expuestas para determinar el resultado. También son útiles para enfermedades con largos periodos de latencia. Los estudios de casos y controles suelen ser el diseño de estudio inicial utilizado para evaluar la relación de una exposición concreta y un resultado. Si este estudio es positivo, entonces se puede emprender un estudio con un diseño más complejo y sólido (de cohortes o experimentales). Asimismo, los estudios de casos y controles suelen ser baratos y requieren menos tiempo que los estudios de cohortes. Además, una vez identificados e incluidos los casos y los controles, suele ser fácil estudiar la relación del resultado (desenlace) no con una, sino con varias exposiciones o factores de riesgo.
Su limitación más importante es que son muy susceptibles a la introducción de sesgos tanto en la selección de los grupos como en la información que se obtiene sobre los factores de riesgo (véase previamente). Además, los factores de confusión también deben ser tenidos en cuenta en los estudios de casos y controles. Por ejemplo, siguiendo el ejemplo anterior, las mujeres con insatisfacción corporal y los controles podrían haber tenido un diagnóstico previo de un trastorno de la alimentación (por ejemplo, anorexia nerviosa). Este factores podrían influir tanto en la probabilidad de haber elegido ser bailarina (exposición) como en el riesgo de desarrollo de insatisfacción de la imagen corporal, afectando a la medición de su asociación. En ocasiones, en los estudios de casos y controles es difícil establecer la secuencia temporal entre la exposición y la enfermedad y no son un buen diseño para estudiar más de una enfermedad de forma simultánea. Por último, los estudios de casos y controles no proporcionan una estimación directa de la incidencia ni de la prevalencia de una enfermedad, ya que la proporción de los participantes en el estudio que tienen la exposición está determinada por el investigador47.
Estudios descriptivos
En las ciencias médicas y de la salud, los estudios descriptivos tienen por finalidad reportar la frecuencia y las características de un problema de salud en una población. Asimismo, pueden también describir la asociación entre dos o más variables (sin asumir una relación causal entre ellas) en un mismo grupo de sujetos (puesto que no tienen grupo de comparación, como lo estudios analíticos)48. Entonces, los estudios descriptivos son útiles para generar hipótesis razonables que deberán contrastarse posteriormente mediante estudios analíticos. Los estudios descriptivos pueden ser de varios tipos, a saber: estudios de prevalencia y asociación cruzada, estudios ecológicos, series de casos, evaluación de pruebas diagnósticas y estudios de concordancia.
Estudios de prevalencia y asociación cruzada
Los estudios de prevalencia (también denominados estudios transversales, del inglés cross-sectional studies) implican la recopilación de información sobre la presencia o el nivel de una o más variables de interés, ya sean la exposición (por ejemplo, un factor de riesgo) o el resultado (por ejemplo, una enfermedad) tal y como existen en una población definida en un momento determinado48. Dicho de otro modo, examinan la presencia o ausencia de una enfermedad y simultáneamente se investiga la presencia o la ausencia de una exposición, en el mismo momento del tiempo. Dado que la exposición y el desenlace son medidos en el mismo momento, la relación temporal entre ambos no es clara, no pudiendo establecerse si la exposición precede el desenlace40. En estos estudios es la prevalencia, y no la incidencia, el principal foco de atención.
Se puede considerar que los estudios de prevalencia proporcionan una “instantánea” de la frecuencia y las características de una enfermedad en una población en un momento determinado. Son muy útiles, entonces, para medir la prevalencia de una enfermedad o de un factor de riesgo en una población, lo que permite evaluar la carga de morbilidad y las necesidades sanitarias. Se basan en definir con precisión una población de estudio y seleccionar de ella una muestra representativa, a partir de la cual se pueda calcular con qué frecuencia las personas presentan la característica o enfermedad en estudio. La representatividad de la muestra, la precisión y calidad de los datos recogidos y el hecho de que haya relativamente pocas personas (“no respuestas”) en las que no se pueda determinarse la presencia de la enfermedad contribuirán a la validez de los resultados13.
Si los datos obtenidos se utilizan solo para determinar la distribución de una o más variables, son estudios puramente “descriptivos”. Sin embargo, muy frecuentemente, el investigador también evalúa la relación entre la exposición y el resultado o desenlace, por lo que estos estudios también, al tener una orientación analítica, permiten valorar la existencia de asociaciones entre variables (asociaciones cruzadas), sin asumir una inferencia causal entre ellas. Es decir, los estudios de prevalencia y asociación cruzada también pueden dar información sobre la relación entre dos o más variables en un mismo grupo de sujetos, sin considerar a una de ellas como dependiente de la otra, es decir, sin asumir ninguna secuencia temporal, ni relación causa-efecto entre ellas40. Esto último se debe a que las variables se miden simultáneamente o durante un período corto de tiempo y, además, a que el valor de una variable en un individuo en el momento en que se realiza el estudio puede diferir significativamente de su valor en el pasado. Sin embargo, cuando se investigan rasgos que son constantes, como el tipo de sangre, o variables donde existe una fuerte correlación entre valores presentes y pasados, esta limitación es menos significativa.
Aspectos metodológicos
Algunos autores6,48) consideran que los estudios de prevalencia y asociación cruzada son estudios analíticos, como los estudios de cohortes y los estudios de casos y controles. No obstante, los autores de este artículo sostenemos, basándonos principalmente en la imposibilidad que tiene este tipo de diseño de determinar relaciones causa-efecto, que los estudios de prevalencia y asociación cruzada son estudios descriptivos, ya que no pueden establecer inferencias causales, aunque sí pueden evidenciar relaciones estadísticas de gran importancia para la investigación biomédica y la salud pública12,13,40,49.
Aquí está el ejemplo de un estudio cuyo objetivo fue describir el impacto de la infodemia de COVID-19 (exposición a noticias relacionadas con COVID-19) en términos de síntomas depresivos en la población general paraguaya50. Se trató de un estudio observacional, descriptivo, de prevalencia y asociación cruzada. El muestreo fue no probabilístico, de casos consecutivos. Los participantes fueron reclutados a través de una encuesta online, diseñada en Google Forms, que fue compartida a nivel nacional a través de redes sociales (Facebook, Twitter, Instagram) y aplicaciones de mensajería (WhatsApp, Telegram). Todos los participantes recibieron información completa sobre el objetivo del estudio, la privacidad y el uso de los datos. Se recabaron datos sociodemográficos (sexo, edad, estado civil y estado social), socioeconómicos (nivel educacional, estado de empleo, ingresos mensuales), salud relacionada a la COVID-19 (diagnóstico positivo de COVID-19, contacto positivo con una persona diagnosticada) y estado de salud mental (si habían sido o no diagnosticados previamente con depresión). Además, se pidió a los participantes que informaran con precisión de a) cuántas horas habían dedicado a buscar noticias sobre COVID-19 en las últimas dos semanas; b) su principal fuente de información sobre COVID-19 (redes sociales, radio, televisión, revistas / artículos científicos); y c) de quiénes recibían la información (líderes de opinión, organizaciones sanitarias, amigos, compañeros de trabajo, familiares). Por último, se empleó el Inventario de Salud Mental de 5 ítems (Mental Health Inventory-5, MHI-5) para detectar síntomas depresivos.
Participaron del estudio 1102 personas: 74,9 % eran mujeres, y la edad media fue de 35,4 ± 12,9 años de edad. La puntuación media del MHI-5 fue de 44,07 ± 14,16, y el 34,4 % (n = 379) de los encuestados presentaban síntomas graves de depresión (>52, como punto de corte). El 53,5 % de la muestra declaró haber estado expuesto entre 1 y 3 horas diarias a las noticias de COVID-19. Hasta aquí el estudio describía las características encontradas de la población estudiada, y no evaluaba la relación entre variables ni ponía a prueba una hipótesis causal: tratándose entonces de un estudio de prevalencia. Los datos recogidos serían útiles a los responsables de salud pública para gestionar planes que hagan frente a los trastornos depresivos en población general.
Posteriormente, los autores analizaron la relación entre la depresión (un resultado) con la cantidad de horas diarias que las personas habían estado expuestas a noticias sobre COVID-19, su principal fuente de información y de quiénes recibían esa información, así como con los datos demográficos, socioeconómicos, estado de salud relacionada a la COVID-19 y estado de salud mental. La edad se asoció negativamente con los síntomas de depresión (r = -0,273, p <0,01), lo que indicó una relación débil e inversa. Se reportaron puntuaciones medias de MHI-5 más altas asociadas a las redes sociales que a la radio/televisión (p = 0,001), y puntuaciones medias más bajas asociadas a los artículos científicos en comparación con las redes sociales (p = 0,001). Se estructuró una regresión multivariante para confirmar la relevancia de una mayor exposición diaria a noticias relacionadas con la COVID-19 en función de los datos sociodemográficos. La única variable significativa fue “si los participantes habían estado en contacto con una persona que dio positivo en la prueba de COVID-19″, con un OR = 1,12 (p = 0,006). Al comprobar la asociación entre la exposición a noticias relacionadas con la COVID-19 (1-6 horas y 7 horas o más) y la presencia de depresión, se encontró un OR = 1,933 (IC 95 % 1,48 - 2,52), lo que puede sugerir que las personas expuestas a noticias relacionadas con el COVID-19 durante más horas al día tienen 1,933 más chances de presentar síntomas prevalentes de depresión. En un análisis post hoc todas las asociaciones fueron significativas (p <0,001). Esta parte del estudio fue de asociación cruzada, puesto que buscó la relación entre los diferentes factores citados previamente con el desenlace (desarrollo de depresión), sin asumir inferencias causales entre ellos.
En los estudios de prevalencia y asociación cruzada, las medidas de asociación clásicamente descritas son odds ratio (OR) (ya visto previamente en este artículo) y razón de prevalencias (prevalence ratio, PR). Estas dos medidas muestran el grado de asociación que existe entre una enfermedad o condición de interés y cierta exposición, sin implicar causa/efecto. El PR se define en términos de cuántas veces es más probable que los individuos expuestos presenten la enfermedad o condición respecto a aquellos individuos no expuestos. En cambio, el OR se define como el exceso o defecto de ventaja (“odds”, “chances”) que tienen los individuos expuestos de padecer la enfermedad o condición frente a no padecerla, respecto a la ventaja (o defecto) de los individuos no expuestos de presentar la condición frente a no presentarla. En el estudio anterior, el OR se calculó para medir el exceso o defecto de ventaja que tenían los individuos expuestos (por ejemplo, a más horas de noticias sobre COVID-19) de padecer la condición (síntomas depresivos) frente a no padecerla, respecto de la ventaja (o defecto) de los individuos no expuestos (a más horas de noticias sobre COVID-19) de presentar la condición (síntomas depresivos) frente a no presentarla.
Ventajas y limitaciones
Los estudios de prevalencia y asociación cruzada son útiles para para estimar la frecuencia de una enfermedad (resultado, desenlace o evento de interés) y de la exposición simultáneamente. Asimismo, a través de estos estudios pueden investigarse múltiples enfermedades simultáneamente. Al enfocarse en muestras representativas de la población de estudio se facilita la extrapolación de los resultados. Como su foco es la prevalencia, son útiles para la planificación de servicios sanitarios. Entre sus limitaciones se destaca que, al estudiar casos prevalentes, estos pueden no ser representativos de todos las personas con la enfermedad al no incluirse, por ejemplo, los casos que han sido rápidamente letales. Además, estos estudios no son capaces de establecer la secuencia temporal de las variables estudiadas. Tampoco son útiles para enfermedades poco frecuentes. Por último, existe la posibilidad de que se introduzcan sesgos de supervivencia y debido a las no respuestas13. El sesgo de supervivencia (un tipo de sesgo selección) se produce cuando los investigadores se centran en individuos, grupos o casos que han superado algún tipo de proceso de selección e ignoran a los que no lo han hecho. El sesgo de supervivencia puede llevar a los investigadores a extraer conclusiones erróneas al estudiar sólo un subconjunto de la población. Por su parte, las no respuestas pueden generar un sesgo en la estimación del resultado, puesto que la prevalencia de un resultado podría diferir entre los que no participan del estudio de los que sí lo hacen. Normalmente, cuando se habla de no respuesta, se hace referencia a estudios de prevalencia y de asociación cruzada en los que se ha elegido una muestra de sujetos de la que se van a recopilar datos específicos. Las no respuestas son sujetos que forman parte de esa muestra, pero que no participan en el estudio o de los que no se puede obtener la información deseada. En consecuencia, el principio de representatividad puede romperse al analizar únicamente el grupo de sujetos sobre los que se dispone de información.
La Figura 6 informa los resultados de un ejemplo hipotético, construido con base en el estudio de la infodemia de COVID-19 y síntomas depresivos en la población general paraguaya antes descrito50. Se observa que la prevalencia estimada de síntomas graves de depresión sería del 34,4 % si solo se tuvieran en cuenta los resultados de los participantes. Sin embargo, la prevalencia real en el total de la muestra es del 38,4 %. Las diferencias aparecen porque el 44,4 % de las no respuestas padecía la enfermedad.
No hay un umbral establecido sobre cuántas no respuestas deben estar presentes para que un estudio se considere inválido. La probabilidad de obtener resultados sesgados depende de la brecha de prevalencia entre participantes y no participantes, aunque lógicamente, la posibilidad es mayor cuanto mayor sea la tasa de no respuesta. Deben utilizarse todas las estrategias posibles para reducir el porcentaje de no respuestas. Una recomendación sería calcular el tamaño muestral e intentar incluir siempre a más participantes del mínimo necesario en la investigación. Todo esto es importante, puesto que la representatividad de la muestra debe garantizarse a lo largo de todo el proceso de investigación de forma que se eviten cualquier tipo de sesgos en el análisis de los resultados.
Estudios ecológicos
Los estudios ecológicos comparten la característica central de temporalidad de los estudios de prevalencia y asociación cruzada, puesto que las variables explicativas (factores de exposición o riesgo) como las explicadas (resultados o desenlaces) son recogidas simultáneamente49.
En este tipo de diseño, las unidades de análisis son grupos de individuos, agregados según criterios geográficos o temporales. Los estudios ecológicos son rápidos, económicos y no complicados, especialmente si la información que se pretende recoger está disponible en bases de datos o anuarios estadísticos.
Estudios ecológicos por agrupación geográfica
Un enfoque habitual consiste en utilizar agrupaciones geográficas (países, regiones, ciudades o incluso barrios de una misma ciudad) para medir la frecuencia de un determinado evento de interés (incidencia, prevalencia, mortalidad, etcétera.) en varias áreas, buscando la detección de algún patrón de tipo geográfico. Estos estudios pueden permiten el desarrollo de hipótesis sobre factores sociales, culturales, económicos, de estilo de vida, ambientales e incluso genéticos a partir de la observación de algunas diferencias en relación con un patrón geográfico13,51.
Un ejemplo de estudio ecológico por agrupación geográfica fue el realizado por Molodynski et al., que trató sobre cómo las variaciones culturales influían en el bienestar, burnout y uso de sustancias en estudiantes de Medicina de doce países, distribuidos en los cinco continentes52. Los investigadores sostenían que cada vez existían más pruebas de que los estudiantes de Medicina manifiestan niveles muy elevados de angustia, burnout (agotamiento) y abuso de sustancias. Se tomaron muestras de grandes grupos de estudiantes de Medicina en 12 países (Brasil, Canadá, Gales, Hong Kong, India, Inglaterra, Italia, Jordania, Marruecos, Nueva Zelanda, Paraguay y Portugal), simultáneamente, y con exactamente el mismo método para facilitar la comparación directa. 3766 estudiantes participaron de la investigación. Los resultados informaron que los estudiantes de los 12 países presentaban niveles muy altos de "casuística" en medidas validadas de síntomas psiquiátricos y agotamiento, con variaciones entre países. Las tasas de abuso de sustancias y las fuentes de estrés identificadas también variaron entre los distintos grupos. Todas estas variaciones estaban muy influenciadas por factores culturales.
Otro ejemplo de estudio ecológico por agrupación geográfica fue el realizado por Estigarribia et al., que trató sobre la filogeografía y transmisión de Mycobacterium tuberculosis en cárceles y comunidades aledañas de Paraguay53. Los autores resaltaban que el reciente aumento de los casos nuevos de tuberculosis en Paraguay y la creciente concentración de tuberculosis en las cárceles ponían de relieve la urgencia de orientar las estrategias para interrumpir la transmisión y prevenir nuevas infecciones. No obstante, se desconocía si determinadas ciudades o instituciones carcelarias desempeñaban un papel desproporcionado en la transmisión de la enfermedad. Los autores llevaron a cabo una vigilancia genómica, secuenciando 471 genomas del complejo Mycobacterium tuberculosis, dentro y fuera de las prisiones, en las dos áreas urbanas más grandes de Paraguay (Asunción y Ciudad del Este), desde 2016 hasta 2021. Se encontró evidencia genómica de transmisión reciente frecuente dentro de las prisiones y vínculos de transmisión entre las prisiones y las poblaciones circundantes. Se identificó una señal de propagación frecuente de Mycobacterium tuberculosis entre zonas urbanas y una marcada expansión reciente del tamaño de la población de los tres mayores conglomerados genómicos. Los resultados obtenidos destacaron la urgencia de fortalecer los programas de control de la tuberculosis para reducir el riesgo de transmisión dentro de las cárceles en Paraguay, donde la incidencia fue 70 veces mayor que fuera de estas.
Estudios ecológicos de series temporales
Los estudios ecológicos de series temporales describen los cambios en la frecuencia de un problema de salud (resultado o evento de interés) a lo largo del tiempo y buscan patrones o tendencias estacionales. Pueden ser útiles para desarrollar hipótesis predictivas sobre la frecuencia con la que ocurrirá ese resultado en el futuro y, en consecuencia, la necesidad de establecer sistemas de atención, o para valorar intervenciones y programas de salud.
Torales et al. realizaron dos estudios ecológicos de series temporales a través de los que se investigaron las muertes por suicidio en población adulta54 y en población de niños y adolescentes55 de Paraguay, entre los años 2004 y 2022. Los casos de muertes por suicidio se agruparon también según la procedencia de los pacientes: la capital y los 17 departamentos que conforman el país.
En ambos estudios se utilizó información proveniente de los registros de la Dirección General de Información Estratégica en Salud del Ministerio de Salud Pública y Bienestar Social de Paraguay. Las variables registradas en los certificados y disponibles para el estudio fueron: edad (en años), sexo (masculino, femenino), origen (por Departamento Paraguay), año de ocurrencia del suicidio (2004-2022), zona de residencia (urbana, rural), y método de muerte por suicidio (según la 10ª edición de la Clasificación Internacional de Enfermedades de la Organización Mundial de la Salud, (CIE-10)56.
En población adulta de Paraguay, en un periodo de 18 años, se registraron 5527 muertes por suicidio. La edad media de los pacientes fue de 36,8 ± 17 años. Un 76,77 % de ellos era del sexo masculino, 77,44 % provenía de un área urbana y 25,98 % del Gran Asunción y Departamento Central. El método de suicidio más frecuentemente utilizado fue la autolesión intencional por ahorcamiento, estrangulación o asfixia (67,6 %). Las tasas de suicidio oscilaron entre 5,41 y 10,84 por 100000 habitantes. Los investigadores realizaron un modelado matemático con regresión lineal simple, en la que la variable independiente (x) se tomó como el año de ocurrencia de los casos de suicidio, y la variable dependiente (y) fue el número de suicidios. Esto se hizo para predecir el número de suicidios en los cinco años siguientes. El análisis permitió calcular el número esperado de suicidios en la población adulta paraguaya para los siguientes años, 2023 a 2027, resultando en 462, 479, 496, 513 y 530 suicidios, respectivamente54.
De manera similar, en el mismo periodo de tiempo, se registraron 940 muertes de niños y adolescentes por suicidio en Paraguay. La edad media de los pacientes fue de 15,05 ± 1,8 años. Un 51,17 % de ellos eran varones, 74,6 % provenía de un área urbana y 22,2 % del Gran Asunción y Departamento Central. Al igual que en población adulta, el método de suicidio más frecuentemente utilizado en niños y adolescentes fue la autolesión intencional por ahorcamiento, estrangulación o asfixia (75,3 %). Las tasas de suicidio oscilaron entre 1,49 y 3,68 por 100 000 habitantes. Los investigadores realizaron también un modelado matemático con regresión lineal simple para predecir el número de suicidios en los siguientes cinco años. La variable independiente (x) se tomó como el año de ocurrencia de los casos de suicidio, y la variable dependiente (y) fue el número de suicidios. Se estableció así que el número esperado de suicidios en población pediátrica de Paraguay, para los años 2023 a 2027, es de 72, 74, 76, 78 y 81, respectivamente55.
Estudios de correlación ecológica
Algunos estudios ecológicos son correlacionales y permiten observar la asociación entre la exposición y el desenlace en poblaciones, analizando la frecuencia de ese desenlace o evento de interés desde una perspectiva colectiva-espacial. La medida de asociación que se utiliza aquí entre la exposición y el evento es el coeficiente de correlación de Pearson (ρ), que indica cuan lineal es la relación entre las dos variables, siempre y cuando ambas sean cuantitativas y continuas.
El valor del índice de correlación varía en el intervalo [-1, 1], indicando el signo el sentido de la relación. Una correlación positiva (ρ=1, ρ>0 pero <1) indica la existencia de una dependencia directa entre las dos variables: cuando una de ellas aumenta, la otra también lo hace. Una correlación negativa (ρ=-1, ρ<0 pero >-1) indica una relación opuesta entre las variables: cuando una de ellas aumenta, la otra cambia su signo en proporción constante. Por último, si ρ=0, se puede concluir que no existe relación lineal (aunque esto no necesariamente implica que las variables son independientes, puesto que podrían existir todavía relaciones no lineales entre las estas)57.
Ventajas y limitaciones
Los estudios ecológicos son rápidos, fáciles de realizar y económicos. Una ventaja es que, muchas veces, se basan en el uso de datos ya existentes en bases de datos o registros epidemiológicos, lo que permite que puedan compararse múltiples variables con la frecuencia de una enfermedad o desenlace, hasta encontrar alguna que sea significativa, pero sin poder explicar un mecanismo plausible del resultado. Otra ventaja es que permiten generar hipótesis que luego podrían ser contrastadas con estudios analíticos17.
Una limitación es que no se dispone de información sobre la exposición y el desenlace a nivel individual. Por ello, el hecho de que exista una asociación ecológica no garantiza que también exista de forma individual. Aquí aparece el concepto de falacia ecológica, que es la inferencia falsa que se hace cuando se deduce incorrectamente a nivel individual (es decir, acerca de la variabilidad interindividual) a partir de información a nivel grupal58. Es decir, asumir que todos los miembros de un grupo poseen los mismos rasgos a nivel individual es un tipo de error. Este error ocurre cuando hay factores de riesgo adicionales relacionados con la enfermedad que se pasan por alto y no se distribuyen por igual entre los participantes en los grupos de comparación del estudio40.
Series de casos
Tipo de estudio observacional descriptivo que reporta una sucesión de casos con alguna característica semejante que los vuelve agrupables (similitudes sindrómicas, etiológicas, anatómicas, histológicas, fisiológicas, genéticas, moleculares, del tipo de tratamiento, de algún efecto adverso al tratamiento o de algún estudio complementario, entre otras)59. El número mínimo de casos que deben ser incluidos en este tipo de estudios es variable: algunos autores afirman que un estándar sería entre 2 a 860, en caso de enfermedades poco frecuentes o para describir alguna característica poco investigada. En caso de que la enfermedad sea prevalente, el número de casos incluido debería ser mayor (usualmente >10).
Aspectos metodológicos
Existen dos grandes tipos de series de casos: los transversales y los longitudinales
Las series de casos transversales consisten en la enumeración descriptiva de características seleccionadas, observadas en un momento determinado, en un grupo de personas con un enfermedad o condición común. Por ejemplo, un grupo de médicos investigadores buscó describir las características clínico-epidemiológicas más frecuentes de personas con diagnóstico de un primer episodio psicótico que acudían al servicio de emergencias psiquiátricas del Hospital de Clínicas de la Facultad de Ciencias Médicas de la Universidad Nacional de Asunción (Paraguay)61. Los autores afirmaron que, considerando que la esquizofrenia y otros trastornos psicóticos constituían la mayor parte de los diagnósticos realizados en el servicio de emergencias psiquiátricas del mencionado hospital, conocer las características clínicas y epidemiológicas de los pacientes sería de relevancia para la planificación de la atención que pueda brindarse a estos. 143 casos se incluyeron en la investigación. El 62,8 % era del sexo femenino. La edad media fue 31 ± 13 años. La mayoría de las personas con diagnóstico de primer episodio psicótico provenía del Departamento Central de Paraguay, residía en zonas urbanas, era de nivel económico medio, aproximadamente la mitad tenía antecedentes de trastornos mentales en la familia y presentaba casi dos meses de evolución de la enfermedad. El pensamiento (ideas delirantes), el afecto, la introspección, el humor, el lenguaje y la sensopercepción (alucinaciones) fueron los indicadores más frecuentemente alterados del examen mental.
Otro ejemplo de estudio de series de casos transversales es el publicado por Moreno Leiva et al., que trató sobre casos de leishmaniasis detectados en centros hospitalarios de Paraguay62. En el país, la leishmaniasis cutánea es una enfermedad endémica atribuida en casi todos los casos a Leishmania (Viannia) braziliensis. El objetivo de la investigación fue describir las características demográficas y clínicas de una serie de casos de pacientes con leishmaniasis detectados en el Departamento de Caaguazú y departamentos cercanos (Canindeyú, Alto Paraná y Guairá) de Paraguay. De los casos registrados, 9 fueron hombres y 6 tuvieron entre 50 a 70 años de edad. La lesión atribuible a la enfermedad estuvo más frecuentemente localizada en el tabique nasal (8 casos). En la mayoría de los casos su evolución era inferior a 10 años y en 4 casos dejó cicatriz. La minoría de los pacientes completó tratamiento. Los autores insistieron en la necesidad de realizar un seguimiento regular de los casos de leishmaniasis en Paraguay, con el fin de mejorar la vigilancia sanitaria de la enfermedad y localizar focos de contagio62.
Por su parte, en las series de casos longitudinales (o de seguimiento) se describe la evolución temporal de determinadas características observadas en un grupo de personas con una enfermedad o condición común. En este tipo de series de casos existe una secuencia temporal definida, pero el estudio no evalúa ninguna relación causa-efecto entre las variables. Un ejemplo de estudio de serie de casos longitudinal es el realizado por De Doménico et al., quienes investigaron la estabilidad diagnóstica del trastorno de depresión mayor en personas hospitalizadas en el departamento de Psiquiatría de un hospital universitario63. Existe evidencia que sostiene la existencia de una discordancia entre los diagnósticos al ingreso y al alta de personas con trastornos mentales, lo que genera problemas importantes en cuanto a la estabilidad diagnóstica64,65. El objetivo de la investigación fue determinar la estabilidad diagnóstica del trastorno depresivo mayor al alta de personas hospitalizadas y si se había mantenido el diagnóstico de su ingreso hospitalario. Se revisaron las historias clínicas, al ingreso y al alta, de los personas con diagnóstico inicial de trastorno depresivo mayor, hospitalizados en el Departamento de Psiquiatría del Hospital de Clínicas de la Universidad Nacional de Asunción (Paraguay), entre octubre a diciembre de 2020. Se incluyeron en el estudio a 53 pacientes con diagnóstico de depresión mayor a su ingreso hospitalario (edad media = 35,7 ± 16,5 años). El 79,2 % era del sexo femenino, el 52,8 % era soltero y el 37,7 % procedía del Departamento Central de Paraguay. El diagnóstico más frecuente al alta fue el trastorno límite de la personalidad, en el 35,8% de los casos. El trastorno depresivo mayor se confirmó en el 15,1% de los casos. Los resultados de este estudio, aunque preliminares, permiten describir las trayectorias de los diagnósticos en el Departamento de Psiquiatría de un hospital universitario, y abren la puerta a estudios confirmatorios más complejos63.
Finalizando, vale la pena recordar el concepto de “reporte de caso”, que es una publicación que informa de manera pormenorizada de los síntomas, signos, resultados de estudios auxiliares, tratamiento, complicaciones del tratamiento y seguimiento de un paciente individual, así como las características únicas por el que fuera reportado. Si bien algunos autores incluyen a los reportes de un caso individual dentro de la categoría de estudios observacionales descriptivos12,17,59) quienes escribimos este artículo, al igual que otros autores13, no consideramos esto válido, puesto que los reportes de caso individual carecen de un diseño metodológico como el resto de las investigaciones descritas en este artículo.
Ventajas y limitaciones
Las series de casos permiten la descripción de la historia natural de una enfermedad o evento que se está investigando. Asimismo, al agrupar casos similares, son útiles para la descripción de enfermedades raras o eventos de interés poco frecuentes. Permiten a los investigadores dar a conocer manifestaciones inusuales de las enfermedades, lo que es útil para la vigilancia epidemiológica. Las series de casos son un punto inicial para la formulación de hipótesis de posibles factores de riesgo, que deberán ser contrastadas con estudios analíticos. Entre sus limitaciones, las series de casos se enfrentan a la subjetividad personal de los investigadores (con la generación de sesgos de medición y de reporte). No permiten comparación ni generan evidencia que pueda cambiar la práctica clínica usual. Por último, los posibles factores de riesgo que este tipo de diseño intenta describir podrían deberse solo al azar17.
Evaluación de pruebas diagnósticas
El diagnóstico de una enfermedad es el primer paso en el camino hacia su tratamiento. La evaluación de los procedimientos para lograrlo se realiza en lo que se denominan evaluación de pruebas diagnósticas, que determinan la eficacia con que un instrumento de diagnóstico (por ejemplo, una prueba de laboratorio) detecta la presencia de una enfermedad66. La determinación correcta de los resultados de las pruebas diagnósticas es de vital importancia, ya que un resultado positivo tiene repercusiones no solo en la persona afectada sino en la sociedad en su conjunto (lo que quedó más que evidenciado en la reciente pandemia de COVID-19)67. Es por esto por lo que es crucial que los clínicos e investigadores puedan evaluar correctamente los parámetros de diagnóstico.
Cualquier procedimiento, por simple o complicado que sea, que busca determinar si un paciente tiene una condición específica, supuestamente patológica, pero que no puede ser observado directamente (con ninguno de los cinco sentidos básicos) se denomina prueba diagnóstica. En otras palabras, cuando se evalúa la presencia de cualquier signo patológico, los sentidos normalmente no se consideran pruebas de diagnóstico. Se utiliza el término “condición” en lugar de “enfermedad”, puesto que una prueba diagnóstica también se puede utilizar para diagnosticar procesos o síndromes patológicos, además de enfermedades (o entidades nosológicas)68.
La mayoría de las veces las pruebas diagnósticas se utilizan para informar si una enfermedad se desarrollará o no, pero también pueden utilizarse para estadificarla y para monitorear su curso clínico69.
Aspectos metodológicos
La evaluación del desempeño de una prueba diagnóstica se inicia por la estimación de la magnitud de los errores que pueden cometerse o, dicho mejor de manera inversa, la magnitud de los aciertos que se cometen al intentar “adivinar” (o predecir) un diagnóstico a partir de los resultados que brinde dicho procedimiento68.
Es importante destacar que los valores informados al evaluar una prueba (como se verá más adelante: sensibilidad, especificidad y valores predictivos) surgen de la comparación de la prueba con otra aceptada como gold standard para el diagnóstico de la enfermedad o evento que se está investigando. Este gold standard, la prueba de referencia, es usualmente costoso, complejo, riesgoso o inadecuado para realizar el proceso usual de diagnóstico. Muchas veces, incluso, no es factible contar con una prueba de referencia y solo la evaluación posterior de los individuos potencialmente afectados por la enfermedad, o el criterio clínico, pueden definir con alguna certidumbre la condición final de enfermedad o ausencia de esta70.
A continuación, se presentan de forma sucinta los indicadores estadísticos básicos para evaluar el desempeño de una prueba diagnóstica (sensibilidad, especificidad y valores predictivos), puesto que la discusión acerca de estadísticos más complejos (razones de probabilidad, curvas ROC, entre otros) escapan de las intenciones de este artículo.
Sensibilidad y especificidad
Introducidas originalmente en 194771, las medidas tradicionales y fundamentales del valor diagnóstico de una prueba incluyen su sensibilidad y especificidad. Miden la discriminación diagnóstica de una prueba en relación con un criterio de referencia, que se considera como el estándar objetivo de verdad. Mediante el uso de estos indicadores, es teóricamente posible comparar directamente la eficacia de una prueba con la de otras y anticipar resultados comparables cuando la prueba se usa en varios lugares, como diferentes naciones, regiones o entornos.
La sensibilidad indica la capacidad de la prueba para detectar a un sujeto enfermo, es decir, expresa cuan “sensible” es la prueba a la presencia de la enfermedad 71-73. Para expresarla se utilizan términos probabilísticos: si la enfermedad está presente, ¿cuál es la probabilidad de que el resultado sea positivo? La respuesta es una expresión en términos de probabilidad condicional, es decir, la sensibilidad es la probabilidad de que la prueba identifique como enfermo a aquél que efectivamente lo está.
Por su parte, la especificidad indica la capacidad que tiene la prueba de identificar como sanos (no enfermos) a los que efectivamente lo son. Se define entonces también como una probabilidad condicional, es decir, la especificidad es la probabilidad de que la prueba identifique como no enfermo a aquél que efectivamente no lo está.
Valores predictivos
La sensibilidad y la especificidad se consideran las características operacionales fundamentales de una prueba diagnóstica. Sin embargo, en la práctica su capacidad de cuantificación de la incertidumbre médica es limitada. Los profesionales de la Medicina necesitan más bien evaluar la medida en que sus resultados modifican realmente el grado de conocimiento que se tenía sobre el estado de salud (o enfermedad) del paciente. Entonces, se considera de utilidad conocer la probabilidad de que una persona para la que se haya obtenido un resultado positivo, esté efectivamente enferma; y lo contrario, conocer la probabilidad de que una persona con un resultado negativo esté efectivamente sana (libre de la enfermedad). Las medidas o indicadores que responden a estas interrogantes se conocen como valores predictivos74-76.
El valor predictivo positivo puede definirse como la proporción de individuos con resultado “positivo” que verdaderamente tienen la enfermedad. El valor predictivo negativo, por su parte, es la proporción de individuos con resultado “negativo” que verdaderamente no tienen la enfermedad.
Estudios de concordancia
Los estudios de concordancia se realizan con la finalidad de evaluar si un aparato de medida o un cuestionario, por ejemplo, son fiables, o si dos observadores concuerdan en la medición de una variable77. Las diferentes fuentes de variación (individual, del instrumento y del observador) pueden afectar la forma en que se mide un fenómeno y, en la práctica, puede ser difíciles de distinguir13.
Por ello, cuando se evalúa la fiabilidad de una medida, deben estudiarse diferentes aspectos, a saber: la repetibilidad de la medida, la concordancia intraobservador y la concordancia interobservador.
Repetibilidad
Es la fiabilidad test-retest y su evaluación requiere aplicar el método de medida de la misma manera y a los mismos sujetos en dos o más momentos del tiempo. La evaluación de la repetibilidad sirve para determinar si una prueba da los mismos (o al menos, similares) resultados cuando se aplica a una misma persona (o mismas personas) en más de una ocasión. Requiere, entonces, que las condiciones de aplicación sean iguales en todas las ocasiones.
Concordancia intraobservador
Para su evaluación es necesario que un mismo observador valore en dos o más ocasiones a los mismos sujetos. Este aspecto se refiere al grado de consistencia de un observador consigo mismo al leer o interpretar los resultados de dos medidas independientes de un mismo fenómeno
Concordancia interobservador
Su evaluación requiere que dos o más observadores valoren una misma prueba en una muestra de sujetos, buscándose la consistencia entre dos observadores independientes sobre una medida practicada en una misma persona. Es importante destacar que ninguno de los observadores debe conocer el resultado proporcionado por el otro, con el fin de garantizar la independencia de las medidas entre ambos.
Aspectos metodológicos
Los estudios de concordancia son necesarios para establecer la validez de una nueva técnica de medición o clasificación diagnóstica o para demostrar la casi equivalencia de múltiples técnicas de medición o clasificación. El método apropiado para analizar los estudios de concordancia depende del tipo de escala (cuantitativa o cualitativa) utilizada por los instrumentos o cuestionarios de medición o clasificación que se están comparando. El diagrama de nubes de puntos, el diagrama de Bland-Altman y el coeficiente kappa de Cohen son métodos adecuados para realizar estudios de concordancia, pero una descripción exhaustiva de estos va más allá de los límites de este artículo. Es importante recalcar que los estudios de concordancia no pueden utilizarse para juzgar la corrección de las técnicas utilizadas para la medición o clasificación, sino que muestran el grado de concordancia entre las diferentes técnicas77.
CLASIFICACIÓN SEGÚN EL NÚMERO DE CONTACTOS CON LAS VARIABLES ESTUDIADAS
Otra forma de clasificar los diseños de investigaciones es atendiendo el número de contactos que se tiene con la población en estudio, a saber78: a. estudios transversales, y b. estudios longitudinales.
Los estudios transversales, también conocidos como de one-shot o estudios de estado, son el diseño de estudio más utilizado en muchas áreas de la ciencia, como la de la salud. Este estudio es el más adecuado para estudiar la prevalencia de un determinado fenómeno, situación, problema, actitud o situación tomando un sector de la población en un determinado momento. Este tipo de estudio es útil en la obtención de una “fotografía” o imagen de la población en el momento preciso de la medición realizada. Son estudios transversales puesto que permiten dar un corte de tanto la población como el tiempo, con el fin de localizar lo que se pretende responder mediante el estudio en cuestión. Es decir, en estos estudios los datos de cada sujeto representan esencialmente un momento del tiempo13. Estos datos pueden corresponder a la presencia, ausencia o diferentes grados de una característica o enfermedad (como ocurre, por ejemplo, en los estudios de prevalencia de un problema de salud en una comunidad determinada), o bien examinar la relación entre diferentes variables en una población definida en un momento de tiempo determinado. Dado que las variables se han medido de forma simultánea, en una sola ocasión, no puede establecerse la existencia de una secuencia temporal entre ellas y, por tanto, estos estudios son incapaces de establecer inferencias de causa-efecto. Por definición, los estudios transversales son, a su vez, estudios observacionales descriptivos: estudios de prevalencia y asociación cruzada, estudios ecológicos, series de casos temporales, evaluación de pruebas diagnósticas y estudios de concordancia.
En los estudios longitudinales existe un lapso de tiempo entre las distintas variables que se evalúan, de forma que puede establecerse una secuencia temporal entre ellas. Son útiles cuando se necesita recolectar información fáctica en forma continua. En un estudio longitudinal, se realizan una serie de mediciones a lo largo del tiempo a intervalos regulares, usualmente por largos períodos. En cada medición se van buscando los mismos datos para ver cómo van evolucionando, si bien la población es la misma puede darse el caso que la muestra vaya cambiando debido al paso del tiempo. Un estudio longitudinal puede ser visto como una serie repetitiva de varios estudios transversales. Los estudios longitudinales pueden sufrir de un efecto de condicionamiento que es lo que se describe cuando los sujetos son contactados en forma frecuente y empiezan a conocer lo que se espera de ellos y pueden responder las preguntas sin pensar o pueden perder interés en cuanto a participar en el estudio en sí. Los estudios longitudinales pueden ser observacionales descriptivos, observaciones analíticos o experimentales. Son estudios descriptivos longitudinales: series de casos longitudinales, estudios de incidencia, descripción de la historia natural de una enfermedad o de los efectos de una exposición o intervención no deliberada.
En el caso de los estudios observacionales analíticos, debe tenerse en cuenta, tal como se discutió previamente, la dirección temporal, que puede ir de la exposición al desenlace (estudios de cohortes) o bien desde el desenlace a la exposición (estudios de casos y controles)13. Obviamente, los ensayos clínicos controlados (aleatorizados y no aleatorizados) son también estudios longitudinales, que siguen una dirección temporal similar a los estudios de cohortes (de la exposición al desenlace).
En general, se considera que los estudios longitudinales tienen menos limitaciones a la hora de hacer inferencias etiológicas79 y son esenciales cuando se trata de monitorear cambios entre individuos. Sin embargo, cuando los investigadores están interesados en saber cómo los factores de riesgo afectan a las poblaciones y ya conocen suficientemente una enfermedad cómo para evaluar la dirección temporal de la causa y el efecto, la elección de un diseño longitudinal en lugar de uno transversal es menos obvia. Desde el punto de vista logístico, los estudios longitudinales son más complicados que los transversales y pueden verse afectados por las pérdidas durante el seguimiento y el incumplimiento de los participantes80.
CLASIFICACIÓN SEGÚN EL INICIO DEL ESTUDIO EN RELACIÓN CON LA CRONOLOGÍA DE LOS HECHOS
Esta clasificación distingue a los estudios prospectivos, retrospectivos y ambispectivos. Es importante recalcar que los términos prospectivo y retrospectivo pueden generar confusión, ya que algunos investigadores los aplican también al sentido o dirección temporal de los estudios. Así, por ejemplo, algunos autores utilizan el término prospectivo como sinónimo de cohorte o de estudio longitudinal.
Los autores de este artículo sentamos postura y nos adherimos a lo expuesto por Argimon Pallás y Jiménez Villa13, que definen estos términos de la siguiente manera:
Estudios prospectivos: aquellos cuyo inicio es anterior a los hechos estudiados, de forma que los datos se van obteniendo o recogiendo a medida que van sucediendo. Ejemplos de estudios prospectivos son los estudios experimentales (ensayos clínicos controlados aleatorizados y no aleatorizados) y los estudios de cohorte prospectiva.
Estudios retrospectivos: aquellos cuyo inicio es posterior a los hechos estudiados, de modo que los datos se obtienen de archivos, registros, bases de datos, historias clínicas o de lo que los sujetos o los investigadores reportan. Los estudios de cohorte retrospectiva y los estudios de casos y controles son ejemplos de estudios retrospectivos.
Estudios ambispectivos: aquellos estudios en los que existe una combinación de ambas situaciones. Los estudios ambispectivos están enfocados en tendencias pasadas de un fenómeno y lo estudian hacia al futuro. Parte de los datos son recolectados en forma retrospectiva de los registros anteriores de los sujetos que serán sometidos a una intervención determinada y luego se sigue a los sujetos con el fin de medir el impacto de la intervención. Ejemplos de estudios ambispectivos son los estudios de cohorte bidireccional y algunos ensayos “antes-después” (“pre-post”), ya explicados previamente en este artículo.
Finalizando, y tomando en cuenta que es el inicio del estudio (anterior, posterior o combinación de ambos) con relación a los hechos estudiados el que determina esta clasificación, los estudios observacionales descriptivos (de prevalencia y asociación cruzada, estudios ecológicos, series de casos, evaluación de pruebas diagnósticas o estudios de concordancia) podrán ser prospectivos o retrospectivos.
OTRAS CLASIFICACIONES
Otra manera de clasificar a los estudios es si estos son de aplicación (de acción) o de fundamentación teórica (básica o pura)81. Una investigación aplicada busca encontrar una solución a un problema inmediato que enfrenta la sociedad, mientras una investigación de fundamentación teórica está principalmente enfocada en la generalización y en la formulación de teorías. Investigaciones acerca de fenómenos naturales o aquellos que se dan, por ejemplo, en la matemática pura se englobarían en este tipo de investigaciones. De igual manera, investigaciones acerca del comportamiento humano que buscan hacer generalizaciones se categorizarían como investigaciones básicas o puras. No obstante, si se busca una solución a un problema específico sería entonces una investigación aplicada. De esta manera, las investigaciones aplicadas buscan encontrar soluciones a problemas prácticos apremiantes, mientras que las investigaciones de fundamentación teórica buscan encontrar información que tiene un amplio espectro de aplicación y que agrega nuevos elementos al ya existente corpus de conocimiento científico.
También es posible clasificar a los estudios entre conceptuales o empíricos82. Los estudios conceptuales están relacionados a una idea abstracta o teoría. Son los utilizados por los filósofos o pensadores con el fin de desarrollar nuevos conceptos o reinterpretar otros ya existentes. En cambio, los estudios empíricos se basan en la experiencia o en la observación. Son estudios basados en los datos, que llegan a conclusiones capaces de ser verificadas mediante la observación o por experimentos. La evidencia que proviene de los estudios empíricos, particularmente de los experimentales que se encuentran contenidos dentro de este grupo, es considerada hoy en día la prueba de mayor potencia que se tiene a la hora de evaluar una posible hipótesis.
Conclusión
El diseño de una investigación es crucial, porque sobre este se sostiene el marco para la realización de un estudio. Desafortunadamente, innumerables libros de texto de metodología de la investigación, estadística médica y epidemiología, así como artículos especializados, han descrito a los tipos de diseño de investigación con una pluralidad de visiones que ha hecho que surjan variedades de términos diferentes utilizados para conceptualizarlos83. Todo esto ha generado una confusión (entendible) entre los investigadores, que persiste desde hace décadas84.
En lo que sí hay un consenso granítico es en que el diseño de una investigación proporciona el pegamento que mantiene unido el proyecto de investigación y se utiliza para estructurarlo, para mostrar cómo todas las partes principales del proyecto de investigación trabajan juntas y tratan de abordar las preguntas centrales de este85. De manera similar a una receta de cocina (que proporciona una lista de ingredientes y las instrucciones para preparar un plato), el diseño de investigación proporciona los componentes y el plan para llevar a cabo con éxito un estudio.
Las investigaciones se diseñan de una manera determinada para aumentar las posibilidades de recopilar la información necesaria para responder a una pregunta concreta. La información recogida durante la investigación solo es útil si el diseño de la investigación es sólido y sigue el protocolo de investigación. Seguir cuidadosamente los procedimientos y técnicas descritos en el protocolo de investigación aumentará las posibilidades de que los resultados de la investigación sean precisos y significativos para los demás y, además, que puedan ser replicados por otros investigadores. Cuanto más a menudo se reproduzcan los resultados, más probable será que los investigadores y el público acepten estos hallazgos como ciertos.
Finalizando, es importante tener en cuenta que cada investigación, desde un punto de vista lógico y metodológico, funciona como una unidad cohesiva en la práctica. El diseño es, por tanto, el resultado de la organización interna de la investigación, como respuesta a sus hipótesis teóricas y a sus desafíos empíricos. Los investigadores deberán, por tanto, utilizar la lógica y la experiencia para conocer, antes de la recogida de datos, qué información nos proporcionará un determinado diseño y qué relevancia y fiabilidad se le puede asignar a la luz de la naturaleza del objeto de estudio. Un diseño de investigación adecuado al estudio que estamos realizando servirá de guía a todo el proceso investigativo y logrará cumplir con el objetivo de toda investigación, que es generar conocimiento y solucionar problemas86. Es por todo esto que los investigadores deben formarse, debatir y pensar con criterio para poder identificar plenamente el diseño adecuado, pues esa decisión influirá en el éxito (o fracaso) de la investigación.