key: cord-0865353-m0dp7ozs authors: Sánchez-Villegas, Pablo; Codina, Antonio Daponte title: Modelos predictivos de la epidemia de COVID-19 en España con curvas de Gompertz date: 2020-05-29 journal: Gac Sanit DOI: 10.1016/j.gaceta.2020.05.005 sha: 258acf6c26086afc6074f4edbee2c52a3b99a918 doc_id: 865353 cord_uid: m0dp7ozs RESUMEN Durante la crisis de salud internacional provocada por la pandemia de COVID-19, además de conocer los datos sobre contagios, muertes y ocupación de camas hospitalarias también es necesario hacer predicciones que ayuden a la gestión de la crisis por parte de las autoridades sanitarias. El presente trabajo tiene como objetivo describir la metodología utilizada para la elaboración de modelos predictivos de contagios y defunciones para la epidemia de COVID-19 en España basados en curvas de Gompertz. La metodología se aplica al total del país y a cada una de sus comunidades autónomas. De acuerdo con los datos oficiales publicados a la fecha de realización de este trabajo, y a través de los modelos descritos, estimamos un total de alrededor de 240.000 contagiados y 25.000 fallecidos al final de la epidemia. Pronosticamos el final de la epidemia entre los meses de junio y julio de 2020. ABSTRACT During the international health crisis caused by the COVID-19 pandemic, it is necessary not only to know the data on infections, deaths and the occupation of hospital beds, but also to make predictions that help health authorities in the management of the crisis. The present work aims to describe the methodology used to develop predictive models of infections and deaths for the COVID-19 epidemic in Spain, based on Gompertz curves. The methodology is applied to the country as a whole and to each of its Autonomous Communities. Based on the official data available on the date of this work, and through the models described, we estimate a total of around 240.000 infected and 25.000 deaths at the end of the epidemic. At a national level, we forecast the end of the epidemic between June and July 2020. Durante la crisis de salud internacional provocada por la pandemia de COVID-19, además de conocer los datos sobre contagios, muertes y ocupación de camas hospitalarias también es necesario hacer predicciones que ayuden a la gestión de la crisis por parte de las autoridades sanitarias. El presente trabajo tiene como objetivo describir la metodología utilizada para la elaboración de modelos predictivos de contagios y defunciones para la epidemia de COVID-19 en España basados en curvas de Gompertz. La metodología se aplica al total del país y a cada una de sus comunidades autónomas. De acuerdo con los datos oficiales publicados a la fecha de realización de este trabajo, y a través de los modelos descritos, estimamos un total de alrededor de 240.000 contagiados y 25.000 fallecidos al final de la epidemia. Pronosticamos el final de la epidemia entre los meses de junio y julio de 2020. Durante la crisis de salud internacional provocada por la pandemia de COVID-19 se hace necesario no solo conocer los datos sobre contagios, muertes y ocupación hospitalaria, sino también hacer predicciones que ayuden a la propia gestión de la crisis por parte de las autoridades sanitarias. El presente trabajo tiene como objetivo describir la metodología utilizada para la elaboración de modelos predictivos de contagios y defunciones para la epidemia de COVID-19 en España. Los datos utilizados, desde el 4 de marzo hasta el 22 de abril de 2020, fueron los datos oficiales que ofrecía diariamente el Ministerio de Sanidad de España 1 .  Paso 2: se calculó la primera derivada g(t) de la curva anterior ( fig. 1 , curva de casos diarios). Con los datos acumulados diarios se calculó la curva de Gompertz 3 de tres parámetros que mejor se ajustaba en cada caso a los datos: Se utilizó el modelo de crecimiento de Gompertz en lugar de otros, como el logístico o el Bertalanffy, por haber demostrado ser algo más preciso para predecir los casos acumulados fuera de la provincia china de Hubei 4 , lugar donde se originó la pandemia de COVID-19. Para el ajuste de la curva de Gompertz a los datos acumulados observados se usaron los algoritmos de Nelter-Mead 5 implementados por Nash 6 . El software utilizado para los cálculos fue R 7 a través del paquete drc 8 . De esta manera obtuvimos modelizada la curva de casos acumulados, con la que pudimos estimar cuántos casos acumulados se observarían cualquier día determinado. Esta curva depende exclusivamente de los casos acumulados observados, ya que es la única información que la nutre. El coeficiente a de la curva se corresponde con su asíntota superior, lo que puede interpretarse como el «horizonte» de la epidemia, esto es, el número de casos esperados al final de esta. La primera derivada de la función anterior 9 , la interpretamos como la curva del número de casos diarios: A través de ella se pueden calcular los valores esperados los días futuros. El punto donde esta función alcanza el máximo puede interpretarse como el pico de la epidemia. A partir de las curvas de contagios diarios y de defunciones diarias (g(t)) se hizo una estimación de las fechas en que no se observarán más contagios ni más defunciones (tabla 1). Hay que hacer notar que tanto las predicciones de estas fechas como las de los horizontes son orientativas y no serán precisas si la situación epidemiológica varía sustancialmente. J o u r n a l P r e -p r o o f Presentamos en este trabajo una metodología de fácil uso para modelizar epidemias como la de COVID-19. Consideramos que en esta sencillez radica su fortaleza, ya que se utilizan exclusivamente los datos sobre contagios y defunciones que después se predicen, sin contar con ningún tipo de covariable externa para su cálculo. Esto, por una parte, podría parecer una debilidad al no añadir más información a los modelos, pero así se evita el ruido que podrían introducir esas hipotéticas variables externas. Por otra parte, la ausencia de más información hace que la calidad de las predicciones dependa mucho de la calidad de los datos. Hay que tener en cuenta que las predicciones de los modelos de contagios, sobre todo a partir de aproximadamente la tercera semana de abril de 2020, pueden sufrir grandes variaciones con respecto a los valores observados por los cambios en la definición de caso. No ocurre lo mismo con respecto a los modelos de defunciones, que son más robustos a lo largo del tiempo al no haber sufrido grandes cambios en su definición. Con respecto a las fechas estimadas del fin de la epidemia en cada comunidad autónoma, hay que tener en cuenta que son estimaciones aproximadas y que pueden sufrir alteraciones si se producen cambios bruscos en las tendencias. De hecho, los modelos predecían horizontes de muchos más casos y defunciones a finales de marzo que a partir de la segunda quincena de abril, lo que puede deberse a las medidas de confinamiento tomadas por las autoridades, que tienen un efecto en las curvas de la epidemia a partir de al menos una semana desde su implantación 10 . En cuanto al fin de la epidemia, las fechas en las que se espera que no haya defunciones son anteriores a las fechas en las que se espera que no haya contagios, y esto tiene mucho sentido dado que no todas las personas contagiadas fallecerán y que el porcentaje de personas que sobreviven a la enfermedad es mucho mayor que el de las personas que fallecen. En cualquier caso, en este trabajo presentamos una metodología utilizada para modelizar la epidemia de COVID-19 en España y en sus comunidades autónomas, y el valor que le damos es referente al contexto temporal de la epidemia, aunque somos conscientes de que pasada la crisis esta metodología puede ser matizada. Ministerio de Sanidad -Profesionales -Documentos técnicos para profesionales -Coronavirus Data-driven outbreak forecasting with a simple nonlinear growth model Modeling of the bacterial growth curve Prediction and analysis of coronavirus disease 2019 A simple method for function minimization Compact numerical methods for computers: linear algebra and function minimisation R: A Language and Environment for Statistical Computing Dose-response analysis using R