Introducción
Uno de los cambios más notorios que la pandemia de COVID-19 ha traído a las sociedades son las restricciones que han impactado a la movilidad de las personas. Siendo que aun con la disponibilidad de las vacunas pueden ocurrir saturaciones del sis tema de salud que obliguen a tomar restricciones.
El estudio del efecto de la movilidad sobre la pandemia de COVID-19 sigue dos problemáticas principales. Primero, está la forma en que la movilidad a larga distancia distribuye la pandemia entre distintos puntos geográficos (Kraemer et al., 2020) y segundo, como la movilidad dentro de un entorno geográfico limitado influencia a la transmisión de casos (McGough et al., 2020). Este proyecto se enfoca en la segunda problemática, donde varios estudios presentan que la pandemia estuvo asociada a importantes reducciones de movilidad (Warren & Skillman, 2020) y (Cot et al., 2021), que a su vez implican un crecimiento sub-exponencial en el nú mero de casos activos (Maier & Brockmann, 2020).
La movilidad explica el 48% de la variabilidad de la transmisibilidad del virus, siendo que el resto corresponde posiblemente a variaciones del virus en sí y demás medidas sanitarias (Nouvellet et al., 2021). Sin embargo, no todas las actividades implican los mismos efectos sobre la transmisibilidad, siendo que distintas combinaciones de actividades pueden producir efectos distintos. En ese sentido, un análisis de movilidad que discrimine según la categoría de movilidad ofrece una mejora potencial tanto en la predicción de una epidemia a corto plazo (Wang et al., 2020), como para dar inferencias del efecto de la movilidad (Basellini et al., 2021). En cuanto a modelos predictivos a corto plazo se han aplicado varios abordajes, como modelado con ecuaciones diferenciales parciales (Wang et al., 2020) y ecuaciones diferenciales ordinarias (Linka et al., 2021). Respecto a modelos que dan inferencias del efecto de la movilidad sobre la transmisibilidad, se han aplicado modelos lineales (Yilmazkuday, 2021), (Sampi Bravo & Jooste, 2020), (Linka et al., 2021), (Dainton & Hay, 2021), modelos log-lineales (Noland, 2021), modelos markovianos (Arenas et al., 2020), ecuaciones di ferenciales ordinarias (Linka et al., 2021), regresión de función sobre función (Cintia et al., 2020) y análisis de correlación (Kajitani & Hatayama, 2021). Este trabajo toma los datos de movilidad de Google que registra la variación de movimiento ordenado según las categorías de (i) tiendas y espacios de ocio, (ii) supermercados y farmacias, (iii) parques, (iv) estaciones de transporte, (v) lugares de trabajo y (vi) zonas residenciales (Aktay et al., 2020). Cada uno de los valores registrados en estas categorías es promediado según la semana previa de modo a suavizar las variaciones periódicas semanales. Además, tomamos los datos de casos reportados diarios de COVID-19 y les aplicamos también un promediado según la semana previa. Finalmente, se dividen los casos promediados de reportados en 3 semanas con los del día correspondiente, obteniendo una nueva serie temporal que representa un factor de variación de reportados en 3 semanas. Usando en primer lugar las series de movilidad suavizadas y en segundo lugar la serie de factor de variación de reportados se aplican dos tipos de análisis: (i) un análisis de componentes principales de las series de movilidad, donde se toman los dos primeros componentes analizar que regiones del plano presentan días con un factor de variación de reportados mayor a 1 y cuáles días presentan un factor de variación de reportados menor a 1. (ii) Un análisis de correlación entre las variables de movilidad suavizadas y el factor de variación de reportados. Estos dos tipos de análisis se aplican sobre los datos disponibles de Argentina, Brasil, Canadá, Chile, Estados Unidos, India, México, Polonia, Rusia y Turquía.
El análisis de componentes principales arroja que la separación entre los días con factor de variación de reportados con valores mayores a 1 y menores a 1 varía de país en país, indicando que las variables de movilidad pueden ser más determinantes en ciertos países que otros. El análisis de correlación arroja que la variación de reportados tiende a estar negativamente correlacionada con la movilidad en zonas residenciales, mientras que tiende a valores positivos con las otras variables, para casos con 95% de confianza. Sin embargo, pueden darse excepciones en algunos países y el grado de correlación varía de país en país.
La estructura del trabajo es la siguiente, la Sección 2 detalla la metodología empleada junto al análisis de componentes principales y el análisis de correlación. La Sección 3 presenta los resultados obtenidos con los análisis. Finalmente, la Sección 4 sumaría los resultados.
Materiales y métodos
Los datos se han obtenido de manera gratuita de los Informes de Movilidad Local sobre el COVID-19 de Google, y están disponibles en su sitio web para todos los interesados. Así como lo indican en dicho sitio web: La finalidad de estos Informes de Movilidad Local es proporcionar información valiosa sobre los cambios que se han producido en la movilidad de las personas como consecuencia de las políticas que se han establecido para combatir el COVID-19. Estos informes muestran las tendencias de movimiento a lo largo del tiempo ordenadas por zonas geográficas y clasificadas en diversas categorías de lugares, como tiendas y espacios de ocio, supermercados y farmacias, parques, estaciones de transporte, lugares de trabajo y zonas residenciales. Así se han considerado los mismos atributos que se presentan en los informes, los mismos son:
X 1 representa la categoría correspondiente a las tiendas y espacios de ocio;
X2 representa la categoría correspondiente a los supermercados y farmacias;
X3 representa la categoría correspondiente a los parques;
X4 representa la categoría correspondiente a las estaciones de transporte;
X5 representa la categoría correspondiente a los lugares de trabajo;
X6 representa la categoría correspondiente a las zonas residenciales.
Los valores que pueden tomar cada uno de los atributos Xi se simbolizan mediante xi;j; donde la I nos indica a cuál de los atributos corresponde el valor y la j nos indica el número, contando de manera corrida, del día al cual corresponde; siendo j = 1 el correspondiente al 01 de julio del 2020 y j = 355 para el 19 de junio del 2021. Es importante tener en cuenta que la variación de las xi;j es un número entero tal que - 100 ≤ xi;j ≤ 100.
Estos datos se han clasificado por países, y como ya se ha mencionado abarcan desde el 01 de julio del 2020 al 19 de junio del 2021, y para un mejor manejo de los mismos se han promediado entre los últimos siete días de tal manera que:
1.RR denota el promedio de los últimos siete días anteriores incluyendo al pro- pio día del cambio porcentual desde la línea de base considerada para tiendas y espacios de ocio;
2.GP denota el promedio de los últimos siete días anteriores incluyendo al propio día del cambio porcentual desde la línea de base considerada para supermercados y farmacias;
3.P denota el promedio de los últimos siete días anteriores incluyendo al propio día del cambio porcentual desde la línea de base considerada para parques;
4.TS denota el promedio de los últimos siete días anteriores incluyendo al propio día del cambio porcentual desde la línea de base considerada para estaciones de transporte;
5.W denota el promedio de los últimos siete días anteriores incluyendo al propio día del cambio porcentual desde la línea de base considerada para lugares de trabajo;
6.R denota el promedio de los últimos siete días anteriores incluyendo al propio día del cambio porcentual desde la línea de base considerada para zonas residenciales.
Simbólicamente denotamos:
donde 0 ≤ j ≤ 349
Además se descargaron los datos epidemiológicos sobre la cantidad de test realizados y la de confirmados por países, los cuales se obtuvieron con el paquete COVID-19 que fue ejecutado en RStudio. Estos datos se seleccionaron de tal manera a coincidir con las fechas consideradas en los Informes de Movilidad Local. Para entender mejor, el paquete instalado presenta la cantidad de confirmados desde el primer día acumulando día tras día los cantidad de casos confirmados, así se define confj como la cantidad de nuevos confirmados en el día dj en el país seleccionado.
De la misma se denotan las series de tiempo:
conf1;j como el promedio de confirma- dos de los últimos siete días anteriores incluyendo al propio día dj de la cantidad de nuevos confirmados por día;
conf3;j como el promedio de casos reportados en la tercera semana contando a partir del dia dj considerado inicialmente.
Simbólicamente, tendremos:
donde 7 ≤ j ≤ 356.
Con estos términos definimos:
Además se hizo el análisis de los componentes principales a partir de RR, GP, P, TS, W y R. De cada componente se obtuvo la proporción de la varianza y la proporción acumulativa para conocer la importancia de tales componentes. Finalmente, se realizó una gráfica tomando como ejes los dos primeros componentes principales, coloreando los puntos según el valor de B3.
Para poder hacer el análisis de correlación entre los valores, se utilizaron los D3;j y los mismos se relacionaron con los valores de las categorías RR, GP, P, TS, W y R de tal manera que se fueron seleccionando los que tenían p-valor menor a 0
Resultados
En esta sección evaluamos lo obtenido con (i) la aplicación de análisis de componentes principales sobre las variables de movilidad suavizadas (RR, GP,P, TS, W y R), que además son etiquetadas según el reportados en 3 semanas, (ii) la aplicación de análisis de correlación entre las variables de movilidad suavizadas y el logaritmo natural del factor de variación de reportados en 3 semanas
Análisis de Componentes Principales
Según la Tabla 1 podemos observar que los primeros dos componentes principales sobre las 6 variables suavizadas de movilidad explican más del 90 por ciento de la varianza existente para dichas variables. Por lo tanto un gráfico que incorpore los dos primeros componentes como variables ofrece una buena aproximación de la estructura real de los datos.
Varianza acumulada de los dos primeros componentes principales | |
Argentina | 0.96861 |
Brasil | 0.9017 |
Canadá | 0.99194 |
Chile | 0.97498 |
Estados Unidos | 0.98417 |
India | 0.96998 |
México | 0.96578 |
Polonia | 0.9838 |
Rusia | 0.98304 |
Turquía | 0.9716 |
Los gráficos de las Figuras 1-10, obtenidos respectivamente de Argentina, Brasil, Canadá, Chile, Estados Unidos, India, México, Polonia, Rusia y Turquía, resultan del análisis de componentes principales para cada país donde tomamos al primer componente como eje de abscisas y el segundo componente como eje de ordenadas. Los puntos celestes representan días para los cuales el factor de variación de reportados en 3 semanas es mayor a 1, mientras que los puntos azul oscuro representan días en que el factor de variación de reportados en 3 semanas es menor a 1. Visualmente observamos que países como EEUU, la India o Rusia presentan agrupaciones más o menos homogéneas para cada clase, mientras que países como Brasil o Polonia parecen presentar una mayor superposición de clases. Para ningún país se nota que alguna dirección del plano tienda a dar ventaja a alguna clase, siendo que ambas clases tienden a encontrarse para valores bastante extremos tanto del primer componente como del segundo. Por lo que no se vislumbra ninguna curva simple que separe fácilmente los datos en todos los países.
Análisis de Correlación
Las correlaciones entre el logaritmo natural del factor de variación de reportados en 3 semanas y las variables RR, GP, P, TS, W y R; también muestra diferencias notorias entre los países analizados. La Tabla 2 muestra valores con un valor p menor a 0.05 en negrita resaltando resultados significativos con un 95% de confianza. Argentina muestra una correlación insignificante, mientras que Chile, India y Rusia presentan correlaciones significativas para todas las variables de movilidad. La variable residencia R tiende a tener una correlación negativa entre los casos significativos, aunque puede haber excepciones como EEUU. Las demás variables tienden a valores positivos cuando son significativas, aunque en menor medida la variable supermercados y farmacias GP que es negativa para Canadá y Polonia, o la variable lugares de trabajo W que es negativa para Brasil y EEUU.
País | RR | GP | P | TS | W | R |
Argentina | 0.03422 | 0.09562 | -0.10224 | 0.03192 | -0.05908 | -0.00232 |
Brasil | 0.08026 | 0.08462 | 0.19857 | 0.09491 | -0.16413 | -0.11181 |
Canadá | 0.31208 | -0.13797 | -0.02354 | 0.43087 | 0.13821 | -0.26979 |
Chile | 0.47898 | 0.41445 | 0.51501 | 0.44796 | 0.31973 | -0.57305 |
Estados Unidos | -0.11295 | -0.03982 | 0.03504 | -0.06001 | -0.21759 | 0.10696 |
India | 0.29108 | 0.47291 | 0.23179 | 0.35550 | 0.43701 | -0.46507 |
México | 0.15251 | 0.14422 | 0.23424 | 0.16891 | 0.03659 | 0.08750 |
Polonia | 0.07721 | -0.29487 | -0.04455 | 0.09438 | 0.07172 | -0.15816 |
Rusia | 0.46932 | 0.45646 | 0.28488 | 0.58028 | 0.12518 | -0.37380 |
Turquía | 0.20946 | 0.07842 | 0.08508 | 0.23143 | 0.33762 | -0.23411 |
Conclusiones
Al estudiar la relación entre movilidad y transmi sibilidad del COVID-19 evaluamos más prudente presentar resultados como factores relacionados, en vez de separar entre variables independientes y dependientes. Esto es debido a que variaciones de la transmisibilidad pueden motivar restricciones de la movilidad y al mismo tiempo se aplican restricciones a la movilidad para influir en la transmisibilidad. Mantenemos esta prudencia aunque el factor de variación de transmisibilidad registre un fenómeno que ocurra después de los valores medidos de movi lidad. Además, en este análisis no se aplicó ningún test de causalidad, por lo que evitamos hablar de causa-efecto y preferimos hablar de patrones.
Una de las principales dificultades a la hora de analizar la movilidad, es que existen factores de la pandemia de COVID-19 que van cambiando a lo largo del tiempo, pudiendo modificar la dinámica ya existente. Por ejemplo, al inicio de la pandemia de COVID-19 no se sabía demasiado de tratamientos ni era tan común el uso de mascarillas, mientras que en etapas posteriores ya existen campañas de vacunación masiva. En ese sentido, el efecto pro gresivo de las vacunas tendría un efecto sobre el valor de nuestro factor de variación de reportados. Los análisis aplicados dan sustento a políticas sanitarias comúnmente aplicadas contra el CO- VID-19. El alto porcentaje de varianza acumulada por los dos primeros componentes del análisis de componentes principales muestra que a pesar de te ner 6 dimensiones, la dinámica de movilidad puede ser visualizada en un plano sin truncar demasiado su geometría. Sin embargo, la superposición de clases observada en el análisis de componentes principales para varios países refuerza la evidencia de que la movilidad en sí misma no es suficiente para determinar variaciones en la transmisibilidad del COVID-19 en un plazo de 3 semanas. Además el análisis de correlación muestra que mayor tiempo de permanencia en áreas residenciales es un patrón relacionado a la reducción de la transmisibilidad en 3 semanas puede variar bastante de país en país.