Opinión: Modelos predictivos para el COVID-19 en Chile

Por Núcleo de Investigación en Data Analytics / VRIEA-PUCV.

02.04.2020

La pandemia generará una serie de cambios en la sociedad global que serán asimilados en función de la convivencia social, la protección de la ciudadanía y el resguardo productivo. El Coronavirus evidenció incapacidad de los sistemas de respuesta ante una emergencia invisible, rápida y que se trasladaba o expandía a la velocidad de nuestras actividades cotidianas, movimientos intercontinentales y prácticas culturales.

Las instituciones gubernamentales a nivel mundial se han visto superadas, independiente del nivel de desarrollo de la potencia o la fragilidad del país donde ingresa el COVID-19. Cada nación ha buscado su fórmula para gestionar la crisis sanitaria, apelando, finalmente, a la responsabilidad de la población para evitar los contactos masivos, incluso, a la limitación de las actividades individuales para detener las vinculaciones con otros humanos, salvo que éstas sean vitales.

La persona en el centro de la protección, pero asumiendo que su confinamiento es también una medida para salvaguardar al resto del tejido comunitario. Y ese tejido, a su vez, evita la propagación viral en los otros tejidos sociales, bajo los que mantiene, estrechamente ligada, su existencia e identidad.

Con estructuras organizacionales, soportes físicos, tecnológicos y, por supuesto, limitaciones y constantes cambios, las redes físicas (offline) y virtuales (online), son dimensiones complementarias de las expansiones propias de sujetos complejos, con un grado civilizatorio que requiere estar proyectándose hacia nuevos espacios y tiempos.

Estas características abiertas y dinámicas, son las que también nos han hecho vulnerables. Por ejemplo, la facilidad en la conexión informacional ha producido un nivel de intercambio de datos, sin precedentes en nuestra historia. Los accesos a una multiplicidad de fuentes y reproducción de mensajes que sólo una persona, durante un día, puede efectuar en diversas plataformas, ya lo hubiese deseado, hace algunas décadas, por ejemplo, la totalidad de los integrantes de un organismo público o privado de cualquier sector estratégico gubernamental.

Sin embargo, el peligro creciente de las fake news y la distorsión de la realidad a la que ese individuo, en el presente, puede estar sometido en su espacio digital, entre otras amenazas, es también un tipo de viralización propia de la vida en comunidad. De extrema velocidad, silenciosos, a veces difíciles de detectar, esos virus llevan contenido malicioso, buscan obtener ventajas económicas y tácticas, y pueden generar grandes inconvenientes en las sociedades. A su vez, las informaciones que esa persona consume son trazadas por las grandes compañías digitales, haciéndonos, incluso, predecibles.

En suma, estamos en una intrincada red de generación de datos personales, sociales, nacionales y globales. Tanta data existente como niveles de interacciones posibles, tantos escenarios nuevos como necesidad de estudiarlos, analizarlos y sopesarlos con sus “luces y sombras”, con la finalidad de asegurar mejores accesos, bienestar y políticas públicas a la altura de estas transformaciones.

De hecho, esas amenazas biológicas y digitales, también podrían ser vencidas o controladas mediante respuestas y medidas articuladas, bajo los mismos datos que esos virus dejan en sus lamentables estelas de desolación. Para el caso del COVID-19, la Organización Mundial de Salud (OMS) ha reiterado que la recogida fiable y el tratamiento adecuado de datos son claves para llegar a las mejores conclusiones para enfrentar la pandemia.

El trabajo interdisciplinario de la ciencia de datos o la pertinencia de establecer inteligencia de data para la toma de decisiones en la salud pública, orientando desde el conocimiento científico al liderazgo político (y cómo comunicar aquello desde los mensajes más adecuados para provocar los cambios esperados en la población en las fases más duras de las crisis), son parte del escenario y de lo que hemos observado en algunos países.

Esa toma de decisiones, se basa principalmente en modelos predictivos. Estos modelos extraen patrones de datos históricos y transaccionales para identificar factores determinantes, riesgos, conductas y oportunidades. Es así como los modelos predictivos identifican relaciones entre diferentes factores que permiten valorar riesgos o probabilidades asociadas sobre la base de un conjunto de condiciones, permitiendo al tomador de decisiones objetivar sus tareas con mayor grado de eficiencia/eficacia.

En el caso puntual epidemiológico en el que nos encontramos, herramientas de las matemáticas y la estadística, se han relacionado estrechamente con esta problemática, teniendo una relación muy fructífera desde antaño. Así, en este difícil presente que vivimos como sociedad, hemos visto cómo equipos interdisciplinarios de profesionales, han logrado poner a disposición de la comunidad todo su conocimiento, para organizar y colaborar en el menor tiempo posible, una respuesta sanitaria eficaz.

Una de las herramientas claves para alcanzar el objetivo antes descrito es el “Data Analytics”, el que a través de modelización matemática de procesos contagiosos, intenta dar respuesta a la propagación de estos fenómenos en el tiempo, y modelar su evolución. Este tipo de herramientas, pasan a ser fundamentales para evaluar y tomar decisiones claves a la hora de valorar el desarrollo de epidemias como la del Coronavirus.

El Análisis Predictivo es una de las herramientas que forman parte de un conjunto de técnicas más amplias conocidas como Business Intelligence. Es así como podemos observar hoy en día, diferentes grupos de científicos que han abordado el tema relativo a la expansión en el mundo de esta pandemia, en donde la mayoría de los casos son modelos desarrollados por equipos de Biólogos, Estadísticos y Matemáticos, los que a través de simulaciones y del uso del Big Data, han logrado acercarse a la respuesta sobre la velocidad de contagio del COVID-19 en diferentes regiones del mundo.

Modelos como la curva de Gompertz, que se diseñó originalmente para describir la mortalidad humana y que ahora se aplica también en biología y en demografía, o el modelo SIR (Susceptibles, Infectados y Recuperados), que estudia una población en la que puede desarrollarse una epidemia y tiene como objetivo predecir la evolución temporal de cada una de estas poblaciones, han tratado de dar respuesta a la evolución del Virus.

Como Núcleo de Investigación en Data Analytics, hemos desarrollado una predicción preliminar del número de casos confirmados de COVID-19 para Chile, desde que se detectó el primer caso en el país (03 Marzo 2020), y su proyección hasta fines del mes de Abril. Para ello, trabajamos directamente con modelos de series temporales, para luego ajustar las series más completas a funciones conocidas, utilizadas en estudios poblacionales.

Así, compartimos el pronóstico de 8 mil contagiados para fines de abril, realizado a través de modelos predictivos del tipo determinista y estocástico (Suavizamiento Exponencial Simple, Holt, Brown, Damped Trend Model, ARIMA, SARIMA, otros), los que han sido modelados a través de un polinomio de orden 4, con un nivel de ajuste cercano al 92% y con un Error Porcentual Absoluto Medio (MAPE) de 11,94. Lo anterior nos ha permitido realizar un pronóstico de los casos confirmados para Chile, considerando que exista un escenario de supervigilancia y control estricto por parte de la autoridad sanitaria.

Por último, conviene tener presente, que los modelos matemáticos no son suficientes por sí solos para cuantificar la expansión de una epidemia. Como indica la OMS, la recogida fiable de la data, el tratamiento adecuado y, sobre todo, las condiciones del contexto, son fundamentales para extraer conclusiones correctas y poder divulgarlas/comunicarlas de manera pertinente.

Dirección General de Vinculación con el Medio