Ir a pucv.cl

Núcleo de Investigación en Data Analytics PUCV proyecta más de 8 mil contagiados por coronavirus en Chile para fines de abril

Las cifras generadas por el Núcleo de investigación en Data Analytics de la Pontificia Universidad Católica de Valparaíso, liderado por el Dr. Hanns de la Fuente-Mella, realizó la proyección ocupando modelos predictivos del tipo determinista y estocástico.

30.03.20

El Ingeniero Civil Industrial de la PUCV y profesor adjunto de la Escuela de Comercio, Hanns de la Fuente-Mella, dirige un Núcleo de Investigación en Data Analytics apoyado por la Vicerrectoría de Investigación y Estudios Avanzados de la PUCV, cuyo principal objetivo es extraer patrones de datos históricos, públicos y documentales para identificar factores determinantes, conductuales, riesgosos o de oportunidades en las Ciencias Sociales, con la finalidad de proyectar escenarios futuros y/o predecir acontecimientos no conocidos.

En este sentido, el equipo de trabajo de esta iniciativa está comenzado a investigar las tendencias del contagio del coronavirus en Chile, “porque estamos convencidos de que este será el tema que marcará la agenda social del año 2020, lo que consideramos una buena oportunidad para estudiar las redes sociales mediante inteligencia artificial, junto a nuestro socio estratégico, la empresa Statknows”.

¿Cómo decidieron comenzar esta investigación?

Tras una serie de reuniones con el Dr. Claudio Elórtegui de la Escuela de Periodismo PUCV, quien integra también nuestro Núcleo de Investigación, coincidimos en la importancia de poner nuestra expertise para diseñar instrumentos, análisis y predicciones sobre el tema del coronavirus. Asimismo, la empresa Statknows colocará su equipamiento e infraestructura, lo que genera una alianza estratégica orientada a generar información y datos de calidad al servicio de las personas y que, al mismo tiempo, nos ayudarán a dar vida a publicaciones científicas inéditas en el área, lo que esperamos posicione al Núcleo de Investigación en Data Analytics de la PUCV, como referente nacional en ésta y otras materias.

¿Cree que la autoridad sanitaria aprovecha bien recursos tecnológicos como éste para tomar decisiones?  

El trabajo interdisciplinario que estamos realizando vinculado a la ciencia de datos, es relevante para la toma de decisiones en temas de salud pública, sobre todo, en momentos como el que estamos viviendo, ya que es indispensable comunicar bien para provocar los cambios de conducta esperados de la población en tiempos de crisis.

¿Qué proponen para ello?

Desarrollar modelos predictivos para la toma de decisiones. Estos modelos extraen patrones de datos históricos y transaccionales para identificar factores determinantes, riesgos, conductas y oportunidades. Es así como los modelos predictivos identifican relaciones entre diferentes factores que permiten valorar riesgos o probabilidades asociadas sobre la base de un conjunto de condiciones, permitiendo al tomador de decisiones objetivar sus tareas con mayor grado de eficiencia/eficacia.

¿Qué utilidad tendría para la información que están generando?

En el caso puntual epidemiológico en el que nos encontramos, la información de las herramientas matemáticas y estadísticas existentes, puede ponerse en contexto, a partir de los conocimientos complementarios de equipos de investigación interdisciplinarios. En el caso de “Data Analytics”, queremos a través de modelización matemática de los procesos de contagio del coronavirus, intentar dar respuesta a la propagación de estos fenómenos en el tiempo y modelar su evolución, con el objetivo de que se tomen decisiones con un sustento científico.

¿Este tipo de herramientas se utilizan en otros países?

Por supuesto. El Análisis Predictivo es una de las herramientas que forman parte de un conjunto de técnicas más amplias conocidas como Business Intelligence. Es así como podemos observar hoy en día, diferentes grupos de científicos que han abordado el tema relativo a la expansión en el mundo de esta pandemia, en donde la mayoría de los casos son modelos desarrollados por equipos de Biólogos, Estadísticos y Matemáticos, los que a través de simulaciones y del uso del Big Data, han logrado acercarse a la respuesta sobre la velocidad de contagio del COVID-19 en diferentes regiones del mundo.

¿Podrías darnos algún ejemplo?

Modelos como la curva de Gompertz, que se diseñó originalmente para describir la mortalidad humana y que ahora se aplica también en biología y en demografía, o el modelo SIR (Susceptibles, Infectados y Recuperados), que estudia una población en la que puede desarrollarse una epidemia y tiene como objetivo predecir la evolución temporal de cada una de éstas poblaciones, han tratado de dar respuesta a la evolución del Virus. Es importante mencionar que estos modelos matemáticos son válidos para previsiones a corto plazo, siempre y cuando el virus siga “el ciclo natural matemático” y que el brote se encuentre “vigilado y controlado”.

¿Cuál sería entonces la particularidad de lo que ustedes están haciendo?

Como Núcleo de Investigación en Data Analytics, hemos desarrollado una predicción preliminar del número de casos confirmados de COVID-19 para Chile, desde que se detectó el primer caso en el país (03 Marzo 2020), y su proyección hasta fines del mes de Abril. Para ello, trabajamos directamente con modelos de series temporales, para luego ajustar las series más completas a funciones conocidas, utilizadas en estudios poblacionales.

Así, el pronóstico de 8 mil contagiados para fines de abril, se realizó a través de modelos predictivos del tipo determinista y estocástico (Suavizamiento Exponencial Simple, Holt, Brown, Damped Trend Model, ARIMA, SARIMA, otros), los que han sido modelados a través de un polinomio de orden 4, con un nivel de ajuste cercano al 92% y con un Error Porcentual Absoluto Medio (MAPE) de 11,94. Lo anterior nos ha permitido realizar un pronóstico de los casos confirmados para Chile, considerando que existe un escenario de supervigilancia y control estricto por parte de la autoridad sanitaria.

Considerando que están trabajando con un tema en pleno desarrollo ¿Qué otras variables podrían influir en los resultados?

Es relevante tener presente, que los modelos matemáticos no son suficientes por si solos para cuantificar la expansión de una epidemia, como indica la OMS, la recogida fiable de la data, el tratamiento adecuado, y por sobre todo las condiciones del contexto, son fundamentales para extraer conclusiones correctas y pertinentes.

Por Marcelo Vásquez, Periodista VRIEA PUCV