CIENCIAS NATURALES Y EXACTAS
Original de investigación
Análisis de escenario utilizando técnicas de inteligencia artificial para estudiar el posible comportamiento de la COVID-19
Scenario analysis using artificial intelligence techniques to study the possible behavior of COVID-19
Alejandro Ramón Hernández1
Beatriz
Bello Garcia1
Marilyn
Bello1
María
Matilde García Lorenzo1
Rafael
Bello Pérez1,2
1
Laboratorio de Inteligencia Artificial, Centro de Investigaciones de la Informática
y Departamento de Ciencia de la Computación, Universidad Central Marta
Abreu de Las Villas
2
Miembro de Mérito de la Academia de Ciencias de Cuba
Autor
para correspondencia
Rafael
Bello Pérez
Laboratorio
de Inteligencia Artificial, Centro de Investigaciones de la Informática
y Departamento de Ciencia de la Computación, Universidad Central Marta
Abreu de Las Villas
Correo
electrónico: rbellop@uclv.edu.cu
RESUMEN
Introducción.
El análisis de escenario desarrolla un proceso sistemático para
crear un conjunto de dos a cinco narrativas posibles que describen potenciales
evoluciones de áreas clave en condiciones de incertidumbre, frecuentemente
acompañados de gráficos. Ayuda a explorar un rango de posibles
y plausibles futuros. El contenido del escenario está basado en variables
seleccionadas y su interacción, y el escenario se define en términos
de estos factores claves o descriptores.
Objetivos.
Se ha desarrollado una propuesta para aplicar el análisis de escenario
en el estudio del comportamiento de la COVID-19 en Cuba, en general, y en Villa
Clara, en particular.
Métodos.
Los factores claves empleados son máxima cantidad de diagnósticos
positivos diarios, número de días de duración de la epidemia
y cantidad total de diagnósticos positivos al final de la epidemia. Para
cada escenario se construyen 3 funciones destinadas a mostrar un comportamiento
posible de la epidemia. El proceso para la construcción de las funciones
se basa en técnicas de inteligencia artificial, tales como los conjuntos
borrosos y las metaheurísticas.
Resultados.
Los escenarios construidos muestran concordancia con otros modelos matemáticos
y computacionales desarrollados para el caso nacional y provincial, lo cual
es importante pues en una modelación en condiciones de incertidumbre,
como es esta, la coincidencia de modelos basados en enfoques diferentes es positiva
y puede dar más seguridad a los decisores.
Palabras clave: COVID-19; inteligencia artificial; análisis de escenario; metaheurísticas, conjuntos borrosos
ABSTRACT
Introduction.
Scenario analysis follows a systematic process to create a set of two to five
plausible narratives that describe possible evolutions of key areas under uncertainty,
often accompanied by graphics. Scenario analysis helps to explore a range of
possible and plausible futures. The scenario content is based on selected variables
and their interaction. The scenario is defined in terms of these key factors
or descriptors.
Objective. We have developed a proposal to apply the scenario analysis
to study the behavior of the COVID-19 in Cuba and Villa Clara.
Methods. The key factors used are: the maximum number of positive diagnostic
in a day, the number of days the epidemic lasts and the final number of positive
diagnostic to have at the end of the epidemic. For each scenario, three different
functions to show the behavior of the epidemic are built. The process to build
the functions is based on Artificial Intelligence techniques, that is fuzzy
sets and metaheuristics.
Results. The scenarios developed show behavior similar to other mathematical
and computational models made for the national and provincial cases, which is
important because when the models are built under uncertainty conditions, the
similarities of the results based on different approaches are positive, and
could offer more confidence to the decision makers.
Key words: COVID-19; artificial intelligence; scenario analysis; metaheuristics; fuzzy sets
INTRODUCCIÓN
La aplicación de métodos matemáticos y computacionales para estudiar el comportamiento de las epidemias es un área de investigación bien trabajada desde diferentes aspectos. Los métodos estadísticos y la modelación físico-matemática han sido de los más empleados con este propósito(1-8). Más recientemente las técnicas de inteligencia artificial (IA), especialmente las orientadas al descubrimiento de conocimiento (aprendizaje automático), tienen una atención especial para este propósito(9-16). Las técnicas de inteligencia artificial han sido empleadas también con otros objetivos en el estudio de las epidemias, como la extracción de conocimiento para los procesos de diagnóstico(17,18).
A partir de los estudios realizados se pueden extraer varios elementos de interés:
- Muchos métodos están dirigidos a modelar el comportamiento de la pandemia, incluyendo modelos para la predicción de la cantidad de diagnósticos positivos en el futuro, los momentos principales del comportamiento de la pandemia (crecimiento o decrecimiento del número de infectados, etc.). Estos permiten construir curvas de comportamiento.
- Muchos estudios muestran que las curvas de comportamiento de nuevos casos en las pandemias, cuando se observan durante todo el periodo en que se desarrollaron, tienen 3 secciones principales: una de crecimiento (curva creciente), un periodo de estabilidad (que forma una meseta) y una última sección de decrecimiento de la cantidad de nuevos casos (curva decreciente). Esto se manifiesta en que la curva de casos diagnosticados positivos acumulados se aplana con el tiempo. Ejemplos son estudios realizados para las epidemias como la del Ébola en África y la COVID-19 (2, 3, 6,8,10,13,15,16,19).
- Los métodos usualmente establecen parámetros para hacer las predicciones. Por ejemplo, en algunos métodos se utiliza un estimado del tamaño que tendrá la epidemia; es decir, la cantidad de casos confirmados totales que se tendrán (tamaño esperado de la epidemia)(6). Otros parámetros usados son la cantidad de días de la epidemia y la cantidad de casos máximo por día(2,20).
- La precisión alcanzada por los métodos de pronóstico de la COVID-19 no ha sido muy alta, según se reporta en algunos estudios(13). Por otra parte, Ganyani et al. (21) analizan los problemas de la eficacia de los métodos y cómo la existencia de outliers y la poca cantidad de datos afecta una buena precisión.
- Las técnicas de análisis de escenario se han utilizado para el estudio del comportamiento de las epidemias, mostrando que es otro enfoque útil (14). Guoping et al.(16) plantean que, dado que los parámetros en diferentes periodos cambian continuamente, lo cual dificulta las predicciones, es útil analizar diferentes escenarios; Wu(20) muestra diferentes gráficos para el comportamiento de la epidemia según diferentes escenarios de reducción de la movilidad entre ciudades, y Chowell(3) presenta otro caso.
A partir de los elementos antes relacionados se puede resumir que, aunque se
han desarrollado numerosos métodos para la predicción de las variables
principales asociadas al comportamiento de las epidemias, todavía los
valores inferidos tienen un grado de incertidumbre, lo cual sugiere desarrollar
otros enfoques para el estudio de las epidemias, como el empleo del análisis
de escenario.
Un escenario es una narrativa de una situación, frecuentemente acompañada de gráficos y cuantificación limitada(22-25). El análisis de escenario ayuda a explorar un rango de futuros creíbles y posibles, sigue un proceso sistemático para crear un conjunto de 2 a 5 narrativas creíbles, que describen evoluciones posibles de áreas claves, pero también puede ser de interés que sean en alguna medida sorprendentes o extremos. Los escenarios son imágenes sobre posibles futuros que se construyen combinando valores distintos en diversas variables causales. La elaboración de escenarios no se encuentra condicionada por la disponibilidad de evidencias que respalden la relación de causalidad de las variables ni el valor de cada una de ellas. Es importante reconocer que los escenarios no son predicciones del futuro, sino que presentan un rango razonable de potenciales comportamientos, destacan aspectos centrales y llaman la atención sobre estos. Son herramientas útiles para operar en ambientes que requieren pensamiento a largo plazo para la toma de decisiones en condiciones de incertidumbre.
El análisis de escenario se puede caracterizar con 5 criterios (26):
- se requieren al menos 2 escenarios para reflejar incertidumbre;
- cada escenario tiene que ser creíble;
- los escenarios tienen que ser internamente consistentes;
- cada escenario tiene que ser de interés para el decisor, y
- los escenarios tienen que generar perspectivas nuevas y originales sobre la temática en cuestión.
En consecuencia, el análisis de escenario es útil cuando se trabaja
en ambientes con incertidumbre que llevan a que sean posibles varios desarrollos
futuros en lugar de uno totalmente cierto.
Hay dos enfoques para realizar el análisis de escenario: hacia adelante y hacia atrás. El primero crea proyecciones que pueden ocurrir en el futuro, mientras que en el segundo se determinan posibles situaciones futuras y se trabaja hacia el presente para identificar las situaciones que permitirían alcanzar esa situación futura. El contenido del escenario se basa en variables seleccionadas y su interacción, llamadas factores claves (19). Para determinados valores de esos factores se pueden proyectar escenarios distintos, no uno solo, lo que lleva a la existencia de multiescenarios y, aunque crear numerosos escenarios puede ser más realista, esto generaría más complejidad en su interpretación. No se trata de plasmar todos los escenarios posibles su número sería inmanejable y la técnica analítica perdería utilidad, pues, se insiste, la finalidad no es adivinar lo que va a suceder, sino aprender de esos posibles futuros. Se sugiere trabajar de 2 a 5 escenarios.
El análisis de escenario en el caso del estudio del comportamiento de las epidemias ofrece un enfoque complementario al empleo de los modelos de predicción del comportamiento. Estos modelos generalmente construyen una función para predecir el comportamiento de la epidemia, incluyendo variables como la cantidad de diagnósticos positivos de la enfermedad, tiempo de duración, acumulado total, etc. Al emplear el análisis de escenario se pueden visualizar otros comportamientos posibles del desarrollo de la epidemia de acuerdo con los factores claves. Aunque se puede partir de un modelo de predicción para construir los escenarios, estos también se pueden desarrollar a partir de valores esperados de los factores claves establecidos según el criterio de expertos o decisores, y visualizar cómo sería el comportamiento de la epidemia en esos supuestos.
En este trabajo se propone un método para la construcción de escenarios que utiliza técnicas de inteligencia artificial, entre ellos los conjuntos borrosos y la búsqueda heurística. El método se presenta para estudiar los posibles comportamientos de le epidemia COVID-19 en Cuba, en general, y en Villa Clara, en particular.
MÉTODOS
El propósito del método que se propone es mostrar cómo podría ser el comportamiento que tendrá el diagnóstico de casos positivos de la epidemia en diferentes escenarios definidos por los factores claves. Para este análisis se están estableciendo como factores claves los siguientes:
- MaxAcum: número máximo esperado de diagnosticados positivos durante toda la epidemia, acumulado de infectados al final de la epidemia; se define como un intervalo.
- Días: número de días máximo en que se espera que haya diagnósticos positivos; es decir, nuevos casos.
- MCD: número máximo de casos diagnosticados en un día.
Esto significa que se quiere construir diferentes curvas posibles para el diagnóstico
de positivos que satisfacen los valores dados para los factores claves para
ese escenario. Por ejemplo, podrían ser las curvas de la función
para el escenario en que la epidemia durará 90 días, con un máximo
de reportes diarios de 60 y que al final el acumulado de diagnósticos
positivos estuviera entre 2100 y 2400 (Días = 120, MCD = 60, MaxAcum
=[2100-2400]).
El método que se propone para el análisis de escenario construye una función f que muestre un desarrollo posible de la cantidad de casos diagnosticados positivos a partir de establecer valores para los 3 factores claves. Para un escenario dado pueden existir diferentes formas para la función f que satisfagan los valores establecidos para los factores claves; eso forma un espacio de búsqueda desde el cual se deben seleccionar la o las funciones que más se ajustan al escenario establecido.
Para construir la función f en este trabajo se propone emplear el enfoque de la teoría de los conjuntos borrosos(27,28). Un conjunto borroso se define mediante una función de pertenencia f(x) que asigna un valor en el intervalo [0,1] a los elementos del universo U donde se define el conjunto (f: U ➝ [0,1]). En este problema el universo U es el periodo de duración de la epidemia, y la función f debe alcanzar el máximo (valor 1) cuando se tiene el número máximo de casos diagnosticados en un día, de modo que la función f debe cumplir la restricción definida por la expresión (1), es decir, que la suma total de infectados esté en el rango de acumulado previsto en el escenario:
El problema es encontrar la expresión matemática para esa función f. Pueden existir diferentes funciones que satisfaga la restricción (1), por eso se debe hacer un búsqueda en el espacio de funciones posibles. Para ello se propone un método basado en las técnicas de búsqueda heurística de la inteligencia artificial, en este caso una metaheurística. Para acotar el espacio de búsqueda se puede establecer una forma preliminar para la función f, y teniendo en cuenta lo antes planteado sobre el comportamiento de las epidemias se puede establecer que la función genere una curva con 3 secciones: una creciente, una meseta y una decreciente. Funciones en forma de triángulo, trapecio o campanas, muy empleadas para construir conjuntos borrosos, cumplen este criterio de acuerdo con los modelos usuales de epidemia antes mencionados.
En los escenarios que se mostrarán más adelante se usan la función trapecio y la función campana; en algunos casos los parámetros para el trapecio lo convierte casi en un triángulo de modo que en la práctica se han tenido en cuenta las 3 formas. Para la búsqueda heurística se utiliza la metaheurística Optimización basada en Partículas (en inglés, Particle Swarm Optimization, PSO)(29) como método para optimizar el diseño de la función. En la búsqueda se incluye un mecanismo de limpieza (cleaning) para mejorar la exploración del método, con el cual se mantiene una cierta diferencia entre las partículas que se generan; es decir, se busca la función f en forma de trapecio o campana que describe el comportamiento del número de infectados diarios dados los valores establecidos para el escenario definido por los factores MaxAcum, Días y MCD. La función f se construye como un conjunto borroso y la metaheurística PSO permite buscar la curva que genere un acumulado más cercano al valor de MaxAcum teniendo en cuenta los valores dados para esos factores.
La expresión matemática de un trapecio se muestra en la expresión (2):
El gráfico que representa la función f se construye sobre un plano cartesiano donde el eje de las X son los días que dura la epidemia y el eje de las Y es el grado de pertenencia (valor entre 0 y 1) construido según el factor clave MCD, el grado de pertenencia se acerca al valor 1 cuando el valor de diagnósticos positivos del día se aproxima al valor de MCD (figura 1). Se considera que la curva comienza en el día 0, con 0 diagnosticados, y a partir de allí comienzan a aparecer diagnósticos positivos; es decir, el día 1 del eje X corresponde al día donde se reportaron los primeros casos, y de allí hasta el valor del factor clave Días.
Fig. 1. Función trapezoide.
Según la expresión (2), los parámetros (a, b, c, d)
determinan la forma de la curva. En este caso estamos dando siempre el valor
0 al parámetro a, indicando el inicio de la epidemia. La curva
va creciendo entre los valores de a y b, luego se mantiene constante
entre b y c, y a partir de c comienza a decrecer hasta
llegar al valor d, que será el último día donde
se reporta algún diagnostico positivo.
El problema es encontrar los valores para los parámetros b, c y d de modo que el acumulado total de diagnósticos positivos sea lo más cercano posible a MaxAcum, en un periodo no mayor a Días y la altura de la curva permita alcanzar un grado de pertenencia de 1 cuando el valor de la función f sea MCD. La búsqueda heurística es la que debe encontrar esos valores. Como se dijo antes, no es recomendable presentar muchas alternativas. Por eso, en esta investigación se presentan en cada escenario 3 posibles casos para la función f, los cuales representan posibles comportamientos de la epidemia.
Para lograr una mayor diversidad al construir los 3 posibles casos para la función f se han establecido algunos rangos de valores para los parámetros de la función en cada caso; para cada caso se buscan diferentes juegos de valores para los parámetros (b, c, d) de la función, o sea, se tiene una familia de posibles curvas para ese caso, y de ellas se selecciona una como representante del caso. Ello busca tener diversidad en las funciones; algunas de ellas pudieran representar casos extremos o poco posibles, pero son funciones que satisfacen los factores claves. Esa diversidad ofrece una panorámica más amplia de los futuros posibles que la que aporta una sola curva de predicción.
Con el propósito de encontrar una función con forma de campana se utiliza la expresión (3):
donde a el alto de la campana, b es el centro, y c el ancho.
Para lograr una mayor diversidad en la forma de la campana se busca una curva con forma de campana, pero que no sea simétrica. Para ello usando la expresión (3) se trabaja con dos valores para el parámetro c, uno para los x ≤b y otro para x>b+1; por eso se define un cuarto parámetro d que es el que determina la forma de la parte derecha de la campana.
Otra información que se tiene cuando el análisis de escenario hace ya dentro del periodo de desarrollo de la epidemia es la serie de valores reales de diagnósticos positivos reportados diariamente desde que empezó la pandemia hasta la fecha, y esta información también se puede usar en la construcción de la función f buscando que la curva se aproxime lo más posible a esa serie. Para combinar el ajuste de la función al valor de MaxAcum dado y a la serie de valores reales de reportes diarios que se tiene hasta ese momento se formula una función de evaluación heurística multiobjetivo definida por la expresión (4). La función de evaluación heurística que permite evaluar la calidad de la función f es multiobjetivo, con las dos componentes, se define por la expresión (4):
donde:
- Ajus(f) es una medida de la cercanía del acumulado generado por la función f al valor del factor clave MaxAcum -recuérdese que ese valor es un intervalo, de modo que es la medida en que el valor del acumulado de diagnósticos positivos generado por f se ajusta a ese intervalo-;
- Prec(f) es el ajuste de los valores de diagnósticos diarios generados por f a la serie de diagnósticos que se tiene hasta la fecha.
Para la construcción de la función f se propone el método siguiente, basado en la metaheurística PSO, el cual se formaliza en dos variantes: una para el caso de la forma de trapecio y otra para la campana.
Método (PSOmo-Trapecio)
Para la forma de trapecio se buscan valores para los parámetros (b, c, d), en este caso el valor del parámetro a tiene un valor fijo igual a 0 (a=0) pues se considera que la curva comienza el día de inicio de la epidemia.
Paso 1. Con la metaheurística PSO se buscan diferentes expresiones para la función f, lo que significa encontrar diferentes juegos de parámetros que definen la función. La calidad de las partículas se mide por la función heurística multiobjetivo FO definida por la expresión (4), la cual combina la cantidad de diagnósticos positivos totales (acumulado final) que produce la función y la medida en que los valores de la función se aproximan a la serie de valores diarios reportados hasta el momento.
Para cada escenario se quieren presentar 3 casos que ilustren el comportamiento posible de la cantidad de diagnósticos positivos diarios. Para buscar diversidad en los casos, se construyen grupos de funciones posibles para cada caso.
Paso 2. De cada grupo se seleccionan las mejores funciones, es decir, aquellas que tienen un mejor valor para la función heurística multiobjetivo.
Paso 3. De cada uno de los 3 grupos de mejores trayectorias posibles para la función f se determina la que será elegida para el caso. Se elige la función que tiene mayor área bajo la curva, usando una expresión que modifica el cálculo del área bajo la curva de un trapecio buscando mayor ajuste al escenario.
Método (PSOmo-Campana)
Para la curva con forma de campana se buscan valores para los parámetros (b, c, d), pues el valor de a es igual al valor del factor clave MCD (a=MCD).
Paso 1. Para cada uno de los casos se establecen los dominios de valores para los parámetros b, c y d.
Paso 2. Con la metaheurística PSO se buscan diferentes expresiones para la función f para cada caso, lo que significa encontrar diferentes combinaciones de valores para los parámetros (b, c, d) que definen la función. La calidad de las partículas se mide por la función heurística multiobjetivo FO definida por la expresión (4), la cual combina la cantidad de diagnósticos positivos totales (acumulado final) que produce la función y la medida en que los valores de la función se aproximan a la serie de valores diarios reportados hasta el momento. A esta función se añaden 2 términos: uno que busca que el inicio de la curva esté lo más próximo posible al inicio de los valores de la serie de valores reales, y otro que tiene por objetivo que el valor de la función sea 0 antes de la fecha final establecida para la epidemia.
Paso 3. La mejor partícula de cada caso, es decir, la que tiene mejor valor de la FO, se selecciona como función para el caso.
Estos métodos permiten construir, para cada escenario definido para los
valores de los factores claves MaxAcum, Días y MCD, 3 expresiones para
la función f (una para cada caso) que expresan comportamientos
posibles de la epidemia, las cuales tienen forma de trapecio o campana. Además,
se definen 3 medidas que caracterizan la función para cada caso: ajuste,
precisión y concordancia. Estas medidas calculadas para cada caso son:
- Ajuste al intervalo MaxAcum: cantidad total de diagnósticos positivos que se tendrá según esa expresión para la función (acumulado total de diagnósticos positivos de la epidemia que se tendrá según esa función).
- Precisión con respecto a la serie real hasta el momento: un promedio del error que se tiene entre los diagnosticados diariamente según la función y la serie de diagnósticos reales que se tiene.
- Concordancia con respecto a la curva que más se aproxima a Max: la curva seleccionada para el caso no es la que necesariamente genera una cantidad final de diagnósticos positivos (acumulado total) más cercana al valor dado al factor clave MaxAcum, pues se tiene en cuenta también el grado en que se aproxima a la serie de valores reales. Por eso, esta medida ilustra la diferencia entre el acumulado que produce la función seleccionada para el caso y el que produce la función de su grupo que más se acerca a MaxAcum.
Cuando se utiliza la función con forma de campana solo se considera la medida de ajuste, pues las demás no son necesarias.
RESULTADOS Y DISCUSIÓN
El método para el análisis escenario que se propone se aplicó para estudiar los posibles comportamientos de le epidemia COVID-19 en Cuba y en Villa Clara. Se utilizó la serie de diagnósticos positivos reportada hasta el día 24 de abril del 2020 para evaluar el ajuste de las funciones a los diagnósticos reales tenidos hasta esa fecha.
Resultados del análisis de escenario para Cuba
Para el caso de Cuba se han definido los escenarios teniendo en cuenta los análisis hechos públicos en el país sobre la epidemia, entre ellos los resultados alcanzados por el grupo nacional que estudia la COVID-19 desde la perspectiva matemático-computacional,(30) los cuales construyeron una proyección con 3 comportamientos de la epidemia: favorable, media y crítica. A partir de esos resultados se definen los siguientes escenarios, los cuales difieren fundamentalmente en la cantidad total que se espera tener de diagnósticos positivos al final de la epidemia, aunque en el tercer escenario, que sería el que refleja la peor perspectiva, se establece un periodo de duración mayor: e1=(Dias=120, MCD=60, MaxAcum= [1850,2150]), e2=(Dias=120, MCD=60, MaxAcum= [2775,4300]), y e3=(Dias=150, MCD=60, MaxAcum= [3900,4500]).
Análisis de escenario usando la función trapecio
Escenario 1:
- Factores claves que definen el escenario: (Días: 120; MCD: 60; Acumulado: [1850,2150])
- Tabla de casos para el escenario (el valor entre paréntesis después de la medida Ajuste indica el valor de la función heurística multiobjetivo usada, la cual tiene un óptimo cuando tiene valor 0):
Fig. 2. Escenario 1 para Cuba usando la función trapecio (funciones para cada caso).
A partir de estas funciones se muestran las curvas de acumulados en la figura
3. En este escenario el primer caso es el que mas se ajusta al factor clave
MaxAcum y se acerca a la serie de datos reales. En otros dos casos el acumulado
total excede el rango de valores establecido para este factor clave, lo que
indica que posiblemente el valor de este factor clave (hasta 2150) haya sido
establecido por debajo de lo que se debe esperar.
Fig. 3. Escenario 1 para Cuba usando la función trapecio (acumulado total).
Escenario 2:
- Factores claves que definen el escenario: (Días: 120; MCD: 60; Acumulado: [2775,4300])
- Tabla de casos para el escenario (el valor entre paréntesis después de la medida Ajuste indica el valor de la función heurística multiobjetivo usada, la cual tiene un óptimo cuando tiene valor 0):
Fig. 4. Escenario 2 para Cuba usando la función trapecio (funciones para cada caso).
A partir de estas funciones se obtienen los acumulados mostrados por las curvas
en la figura 5. En este escenario los estimados para el acumulado total en los
3 casos se enmarca el valor establecido para el factor clave, con poco error
en la función de evaluación heurística; mientras que las
curvas de acumulado tienen valores superiores a la serie de valores reales hasta
la fecha. Esto es un indicador positivo porque muestra que, aun teniendo un
comportamiento superior a la serie real, el acumulado total estaría por
debajo del límite superior establecido para este factor clave en este
escenario (4300).
Fig. 5. Escenario 2 para Cuba usando la función trapecio (acumulado total).
Escenario 3:
- Factores claves que definen el escenario: (Días: 150; MCD: 60; Acumulado: [3900,4500])
- Tabla de casos para el escenario (el valor entre paréntesis después de la medida Ajuste indica el valor de la función heurística multiobjetivo usada, la cual tiene un óptimo cuando tiene valor 0).
Fig. 6. Escenario 3 para Cuba usando la función trapecio (funciones para cada caso).
Los acumulados correspondientes a este escenario se muestran en la figura 7. En este escenario las funciones de los 3 casos son similares y se aproximan a la serie de valores reales, pero a diferencia de los escenarios anteriores el descenso de las funciones es más prolongado, o sea, estas tienen una menor pendiente, lo que genera una mayor cantidad de acumulado total, el cual se ajusta al máximo previsto para este factor clave.
Fig. 7. Escenario 3 para Cuba usando la función trapecio (acumulado total).
Usando este mismo escenario se puede ilustrar otra posibilidad de análisis que ofrece el método: se pueden variar algunos parámetros de la función para ver su efecto. Por ejemplo, si se analiza la función del caso 2 en la figura 6, el valor del parámetro c tiene valor 44, y esta curva genera un acumulado de 4224. Se puede incrementar el valor de c, es decir, extender la parte superior del trapecio hasta c=53, y como consecuencia el acumulado sería de 4494, lo que significa que se puede tener 9 días más con el máximo de diagnósticos por día y se mantiene el acumulado en rango establecido. Un incremento mayor de este parámetro ya produciría un acumulado mayor al esperado en ese factor clave.
Análisis de escenario usando la función campana
Para la experimentación con la campana, y buscando mayor variabilidad se establecieron rangos posibles para el valor del parámetro b en cada caso, lo cual desplaza las curvas más a la izquierda o la derecha, y consecuentemente se adaptan los dominios para los parámetros c y d.
Escenario 1:
- Factores claves que definen el escenario: (Días: 120; MCD: 60; Acumulado: [1850,2150])
- Tabla de casos para el escenario (el valor entre paréntesis después de la medida Ajuste indica el valor de la función heurística multiobjetivo usada, la cual tiene un óptimo cuando tiene valor 0):
Fig. 8. Escenario 1 para Cuba usando la función campana (funciones para cada caso).
A partir de estos comportamientos de los diagnósticos diarios positivos el acumulado se muestra en la figura 9. Este es el escenario más favorable porque sería donde menos diagnósticos positivos se tendría al final de la epidemia (menos de 2000); en los casos 1 y 2 entre los días 75-80 se alcanzaría el acumulado total. Nótese que estos casos se ajustan a los valores de la serie real.
Fig. 9. Escenario 1 para Cuba usando la función campana (acumulado total).
Escenario 2:
- Factores claves que definen el escenario: (Días: 120; MCD: 60; Acumulado: [2775,4300])
- Tabla de casos para el escenario (el valor entre paréntesis después de la medida Ajuste indica el valor de la función heurística multiobjetivo usada, la cual tiene un óptimo cuando tiene valor 0):
Fig. 10. Escenario 2 para Cuba usando la función campana (funciones para cada caso).
La curva de acumulados se muestra en la figura 11. En este escenario el comportamiento de la parte izquierda de las curvas de los casos 1 y 2 es similar al escenario 1, y ambas se aproximan a la serie de valores de acumulado real, pero la duración de la epidemia sería mayor aproximadamente a los 100 días, al tener una inclinación menor la curva del lado derecho de la campana. Por eso se genera un acumulado de diagnósticos positivos mayor, cercano a los 3000.
Fig. 11. Escenario 2 para Cuba usando la función campana (acumulado total).
Escenario 3:
- Factores claves que definen el escenario: (Días: 120; MCD: 60; Acumulado: [3900,4500])
- Tabla de casos para el escenario (el valor entre paréntesis después de la medida Ajuste indica el valor de la función heurística multiobjetivo usada, la cual tiene un óptimo cuando tiene valor 0):
Fig. 12. Escenario 3 para Cuba usando la función campana (funciones para cada caso).
En este escenario las curvas de acumulados se muestran en la figura 13. Este es el escenario más pesimista, donde se debe esperar una cantidad mayor de diagnósticos positivos. Sin embargo, es positivo que en ningún caso se alcancen los 4000 en todo el periodo, el cual se extendería más de 120 días.
Fig. 13. Escenario 3 para Cuba usando la función campana (acumulado total).
En este escenario el ajuste entre las curvas construidas y la serie de valores reales es menor que en los escenarios anteriores, lo cual es coherente con el hecho de que se está analizando un escenario más complejo que los anteriores. Esto es un buen indicador porque ratifica que el comportamiento de la epidemia de COVID-19 en Cuba hasta este momento se acerca más al escenario favorable pronosticado por otros métodos matemático-computacionales.
Resultados del análisis de escenario para Villa Clara
Se presenta un análisis de escenario sobre el posible comportamiento de la epidemia de COVID-19 en la provincia de Villa Clara. Para establecer los valores de los factores claves se han considerado los datos calculados por el grupo de modelación matemática de la provincia, que usando métodos numéricos generó un modelo de la epidemia según el cual se espera un acumulado final de 412 con un intervalo de confianza de [350, 420] en un periodo aproximado de 120 días.
Se definió el escenario e=[Días=120, MCD=13, MaxAcum=[350, 420]]. Para este escenario se proponen 3 casos posibles de comportamiento de la epidemia utilizando una curva en forma de campana para modelar el comportamiento diario de diagnósticos positivos. Se presenta también la curva de acumulados para cada caso. Se utiliza la campana pues en los estudios realizados para Cuba mostró que esta curva permitía ajustar mejor las funciones al valor del factor clave MaxAcum.
La figura 14 muestra las curvas que corresponden a cada caso y la serie de diagnósticos diarios real reportada hasta ahora. La alta variabilidad de los valores reales de diagnósticos diarios hace muy difícil encontrar un buen ajuste de las funciones a esa serie de valores.
Fig. 14. Escenario para Villa Clara usando la función campana (funciones para cada caso).
Según los 3 casos, el acumulado final esperado de diagnósticos positivos es 420. Sin embargo, el punto de máximo y el fin de la epidemia difiere en los casos: en el caso 1 se espera un punto máximo entre los 45 y 50 días y termina cerca del día 80; en el caso 2 se alcanza un máximo entre el día 40 y el 45 y una terminación similar, y en el caso 3 en el periodo es de 70 a 75, y termina después del día 100 de la epidemia.
A partir de los 3 casos se construye la curva de acumulados diarios. En la figura 15 se muestra la curva de acumulado para cada caso, la curva de acumulados que genera el método numérico y el acumulado diario reportado hasta ahora (puntos azules).
Fig. 15. Escenario para Villa Clara usando la función campana (acumulado total).
En el gráfico se puede apreciar que el comportamiento del caso 1 es similar al pronosticado por el método numérico y que ambos se aproximan a la serie de valores reales obtenidos hasta ahora. Los otros casos muestran comportamientos diferentes que pudiera la epidemia -recuérdese que esta estimación tiene asociada un grado de incertidumbre y que la realidad depende de diferentes factores-. Sin embargo, estos análisis coinciden en el valor del acumulado final de diagnósticos positivos de alrededor de 420 casos.
Comparación con otros análisis
Antes se ha hecho referencia al trabajo publicado por Figueredo et al.(30) Allí se documentan los resultados alcanzados en el estudio del comportamiento de la epidemia por un grupo multidisciplinario que utilizó diferentes métodos matemático-computacionales en sus estudios. Ellos calculan que se va a tener un tamaño de la epidemia o acumulado de personas contagiadas en un rango de un mínimo de 1500 casos y un máximo de 2500, lo cual se aleja los 4500 casos activos establecidos inicialmente. No obstante, se dice que si se relajan las condiciones actuales, esto puede cambiar, de modo que el peor escenario todavía es posible si no se mantienen las medidas que permitieron bajar los estimados de acumulado total. También se hizo una estimación de que, siguiendo el comportamiento internacional de más de 180 países, el pico debería alcanzarse a los 77 días de evolución de la enfermedad, lo cual ocurriría para finales de mayo. Sin embargo, según la evolución actual, se puede esperar que en los próximos días, a finales de abril o principios de mayo, se alcanzaría el pico, lo que se adelanta a la media internacional. No obstante, se aclara que este es un pronóstico reservado, que dependerá de la evolución de la enfermedad en los próximos días.
Al comparar estas estimaciones con los resultados mostrados por el estudio basado en análisis de escenarios presentado en el actual trabajo se pueden apreciar coincidencias. En el escenario 1 planteado, en 4 de los 6 casos construidos, 3 funciones en forma de trapecio y 3 en funciones de campana, se genera un acumulado total que está en el rango de 1500-2500 casos. El segundo escenario genera acumulados un poco mayores, todos en el entorno de 2500-3000 casos, es decir, no muy lejos de la situación más favorable. Incluso en el escenario 3, establecido para un entorno más desfavorable, los acumulados generados por las funciones construidas están por debajo de los 4500 casos activos estimados inicialmente.
Con respecto a la fecha estimada para el pico y comienzo del declive de la epidemia, varios de los casos en los escenarios estudiados plantean que esta fecha debe estar entre finales de abril y principios de mayo, por ejemplo, en 3 casos del escenario 1. Con todo, varios casos en los 3 escenarios muestran que ya hoy (28 de abril de 2020) se está en ese momento de la epidemia. Prácticamente todos los casos en todos los escenarios, menos los 3 casos extremos en los 3 escenarios, plantean un descenso antes de los 60 días, es decir, anterior a los 77 días establecidos inicialmente según Figueredo et al.(30). Dos de esos casos extremos muestran un pico en el día 72, todavía anterior al estimado de 77.
En relación con el estudio para la provincia de Villa Clara, donde los estimados han sido menos divulgados, sí se puede plantear que las 3 funciones construidas para el escenario definido permiten generar un acumulado de 420 casos, muy cercano del estimado de 412 estimado por los modelos elaborados en esa provincia.
Estas coincidencias aportan señales positivas pues muestran que estudios desarrollados desde perspectivas diferentes producen resultados cercanos. En un dominio caracterizado por la incertidumbre, donde los métodos usados generalmente producen valores aproximados sujetos a esa incertidumbre, el empleo de diferentes enfoques es adecuado, especialmente cuando se puede encontrar similaridad en los resultados.
CONCLUSIONES
Se presenta otro enfoque para analizar el comportamiento de la pandemia COVID-19 basado en el análisis de escenario, un método que no es de predicción ni se basa solo en la serie de datos que se tiene hasta la fecha, como generalmente hacen los métodos para construir esta clase de modelos. El método de análisis de escenario propuesto se basa en técnicas de inteligencia artificial porque se emplea el concepto de conjunto borroso para modelar la función f, en este caso usa una función con forma de trapecio y otra de campana, y una metaheurística para encontrar diferentes expresiones para la función, donde se utiliza la optimización basada en partículas con un mecanismo de limpieza para introducir diversidad en la búsqueda.
Para construir los escenarios se definen valores para los 3 factores claves: duración de la epidemia, máximo valor esperado de diagnósticos positivos en un día y acumulado total de diagnósticos positivos. Estos valores pueden ser establecidos por los expertos o calculados a partir de métodos de predicción, como se muestra en los escenarios que se presentan en la sección de análisis de resultados. Ello significa que el método propuesto puede usarse como complemento de métodos de predicción de modelos, aunque no necesariamente depende de ellos. El método permite construir 3 funciones para cada escenario, y se ha seleccionado la cantidad de 3 por ser una cantidad recomendada en este tipo de análisis.
En los gráficos de cada escenario se muestran las curvas que generan las funciones construidas, funciones en forma de trapecio o campana. Los resultados alcanzados muestran que las funciones en forma de campana permiten obtener curvas que generan un acumulado de diagnósticos positivos total en el rango de valores establecidos para este factor clave. También se presentan las curvas de acumulados para cada caso en cada escenario; esta es una curva monótona creciente hasta el valor total de diagnósticos positivos que se puede esperar según esas funciones. Pueden existir otras formas para estas curvas, de modo que corriendo el método varias veces se pueden construir otras variantes de comportamiento para la cantidad de diagnósticos diarios que se enmarcarían en los valores dados a los factores claves. Esa es una diferencia de este método basado en análisis de escenario con respecto a los métodos de predicción, los cuales usualmente construyen una función para la predicción; con este se pueden analizar otros comportamientos de la curva de predicción que se enmarcan en los factores claves.
Del análisis de los 3 escenarios construidos para estudiar el posible comportamiento de la COVID-19 en Cuba se puede apreciar que el escenario 3 (más pesimista en el sentido de que es donde se espera una mayor cantidad de diagnósticos positivos al final de la epidemia) es el que menos se ajusta a la serie de valores reales que se tiene hasta el momento de este estudio (24 de abril del 2020). Existiendo un mayor ajuste en el caso de los escenarios 1 y 2, los cuales tienen un comportamiento que ratifica que, hasta la fecha, la epidemia en Cuba se desarrolla cerca del escenario más favorable pronosticado por los especialistas(30). En los 3 escenarios se obtienen funciones que permiten calcular una cantidad de diagnósticos finales bastante menor que el valor máximo dado a ese factor clave, lo cual también es un resultado favorable.
En el caso del análisis realizado para un escenario de la provincia de Villa Clara, las funciones permiten esperar en dos casos que cerca del día 50 del inicio se comience un declive de la cantidad de diagnósticos positivos, y en todos los casos las funciones generan un acumulado de cerca de 420 diagnósticos positivos en la provincia. Esto último se corresponde con los pronósticos realizados usando métodos numéricos a partir de los datos de la provincia.
Los resultados alcanzados muestran que el método propuesto para el análisis de escenarios puede ser una herramienta más para estudiar el comportamiento de esta epidemia, en la cual, al igual que en otras, existen muchos factores que inciden en su desarrollo. Esto último genera incertidumbre en todos los modelos de análisis que se utilicen, de modo que más enfoques para estudiarla permiten enriquecer la visión que los decisores pueden tener.
La implementación computacional del método está disponible para realizar los análisis de escenarios que se requieran a partir de nuevas definiciones para los factores claves.
REFERENCIAS BIBLIOGRÁFICAS
1. Viboud C, Simonsen L, Chowell G. A generalized-growth model to characterize the early ascending phase of infectious disease outbreaks. Epidemics, 2016;15: 27-37.
2.
Chowell G. Fitting dynamic models to epidemic outbreaks with quantified
uncertainty: A primer for parameter uncertainty, identifiability, and forecasts,
Infectious Disease Modelling, 2017, doi: 10.1016/j.idm.2017.08.001.
3. Chowell G, Luo GR, Sun K, Roosa K, Tariq A, Viboud C. Real-time forecasting of epidemic trajectories using computational dynamic ensembles. Epidemics. 2019 Dec 21;30:100379. doi: 10.1016/j.epidem.2019.100379. [Epub ahead of print]
4. Ganyani T, Roosa K, Faes C, Hens N, Chowell G. Assessing the relationship between epidemic growth scaling and epidemic size: The 2014-16 Ebola epidemic in West Africa. Epidemiology and Infection. 2019;147(e27):1-6. https://doi.org/10.1017/S0950268818002819
5. Tian-Mu Chen, et al. A mathematical model for simulating the phase-based transmissibility of a novel coronavirus. Infectious Diseases of Poverty. 2020;9:24. https://doi.org/10.1186/s40249-020-00640-3.
6. Kimberlyn Roosa, et al. Short-term Forecasts of the COVID-19 Epidemic in Guangdong and Zhejiang, China: February 13-23, 2020. J. Clin. Med. 2020;9(596). doi:10.3390/jcm9020596.
7. Shi Zhao, et al. Estimating the Unreported Number of Novel Coronavirus (2019-nCoV) Cases in China in the First Half of January 2020: A Data-Driven Modelling Analysis of the Early Outbreak. J. Clin. Med. 2020;9(388). doi:10.3390/jcm9020388
8. Anna L. Ziff, Robert M. Ziff. Fractal kinetics of COVID-19 pandemic. March 2, 2020. preprint doi: https://doi.org/10.1101/2020.02.16.20023820.
9. Mohammed A. A. Al-qaness, Ahmed A. Ewees, Hong Fan, and Mohamed Abd El Abd El Aziz. Optimization method for forecasting confirmed cases of COVID-19 in China. Journal of Clinical Medicine. 2020;9(3):674.
10. Kathakali Biswas y Parongama Sen. Space-time dependence of corona virus (COVID-19) outbreak. arXiv preprint arXiv:2003.11336. 2020.
11. Joseph Bullock et al.. Mapping the landscape of Artificial Intelligence applications against COVID-19. arXiv preprint arXiv:2003.11336. 2020.
12. Guo Q, Li M, Wang C, Wang P, Fang Z, Tan J, Wu S, Xiao Y, Zhu H. Host and infectivity prediction of wuhan 2019 novel coronavirus using deep learning algorithm. bioRxiv (2020). doi:10.1101/2020.01.21.914044. https://www.biorxiv.org/content/early/2020/02/02/2020.01.21.914044.full.pdf
13. Zixin Hu, Qiyang Ge, Shudi Li, Li Jin, Momiao Xiong. Artificial Intelligence Forecasting of COVID-19 in China. 2020. arXiv preprint arXiv:2002.07112, 2020b.
14. Malik Magdon-Ismail. Machine Learning the Phenomenology of COVID-19 From Early Infection Dynamics. arXiv: 2003.07602v2.
15. Zifeng Yang et al. Modified SEIR and AI prediction of the epidemics trend of COVID-19 in China under public health interventions. Journal of Thoracic Disease. 2020;12(3):165-174. March. http://dx.doi.org/10.21037/jtd.2020.02.64
16. Guoping Zhang et al. Forecasting and Analysis of Time Variation of Parameters of COVID-19 Infection in China Using An Improved SEIR Model. Public meteorological service center of China Meteorological Administration. 2020. https://www.researchsquare.com/article/rs-16159/v1
17. Hayden C. Metsky, et al. CRISPR-based COVID-19 surveillance using a genomically-comprehensive machine learning approach. bioRxiv preprint doi: https://doi.org/10.1101/2020.02.26.967026.
18. Li Yan, et al. Prediction of criticality in patients with severe COVID-19 infection using three clinical features: a machine learning-based prognostic model with clinical data in Wuhan. medRxiv preprint medRxiv:L2020.02.27.20028027, 2020.
19. Kosow H, Gaßner R. Methods of future and scenario analysis. Overview, assessment, and selection criteria. DIE Research Project Development Policy: Questions for the Future, p. 133. Studies/Deutsches Institut für Entwicklungspolitik. ISSN 1860-0468. p. 133. 2008.
20. Wu JT, Leung K, Leung GM. Nowcasting and forecasting the potential domestic and international spread of the 2019-nCoV outbreak originating in Wuhan, China: a modelling study. The Lancet. January 31, 2020. https://doi.org/10.1016/S0140-6736(20)30260-9
21. Ganyani T, Roosa K, Faes C, Hens N, Chowell G. Assessing the relationship between epidemic growth scaling and epidemic size: The 2014-16 Ebola epidemic in West Africa. Epidemiology and Infection. 2019;147(e27):1-6. https://doi.org/10.1017/S0950268818002819m
22. Goodwin P, Wright G. Enhancing strategy evaluation in scenario planning: A role for decision analysis. Journal of Management Studies. 2001;38(1).
23. Alistair G. Sutcliffe y Andreas Gregoriades. Automating Scenario Analysis of Human and System Reliability, IEEE transactions on systems, man, and cybernetics-part A: systems and humans. 2007;37(2): 249-261.
24. Sorousha Moayer y Parisa A. Bahri. Hybrid intelligent scenario generator for business strategic planning by using ANFIS. Expert Systems with Applications. 2009;36:7729-7737.
25. Laurent KL, et al. Scenario analysis: An integrative and effective method for bridging disciplines and achieving a thriving Great Lakes-St. Lawrence River basin. Journal of Great Lakes Research. 2014. http://dx.doi.org/10.1016/j.jglr.2014.10.002
26. Muhammad Amer, et al. Development of fuzzy cognitive map (FCM)-based scenarios for wind energy. International Journal of Energy Sector Management. 2011;5(4):564-584, 1750-6220. 2011. DOI 10.1108/17506221111186378
27. Cox E. The fuzzy systems handbook. Academic Press, 1994.
28. Jangm JR, et al. Neuro-fuzzy and soft computing: a computational approach to learning and machine intelligence. Prentice Hall, 1997.
29. Kennedy J, Eberhart RC. Particle swarm optimization. In IEEE International Conference on Neural Networks. 1995, pp. 1942-1948.
30. Figueredo Reinaldo O, Padrón Padilla A, Carmona Tamayo E. COVID-19 en Cuba: El pico se adelanta, ¿qué dicen los modelos matemáticos y cómo interpretarlos? Publicado en Cubadebate, 27 abril 2020. Disponible en: http://www.cubadebate.cu/especiales/2020/04/27/covid-19-en-cuba-el-pico-se-adelanta-que-dicen-los-modelos-matematicos-y-como-interpretarlos/
Contribución científica de cada autor. Alejandro Ramón Hernández participó en el diseño del método, aporte principal en la implementación computacional y el desarrollo del análisis experimental. Beatriz Bello García participó en la implementación computacional del método. Marilyn Bello participó en la recopilación bibliográfica y su análisis. María Matilde García Lorenzo participó en la concepción del método y la preparación de la documentación de la investigación. Rafael Bello Pérez propuso el método para el análisis de escenarios basado en técnicas de inteligencia artificial y los escenarios a desarrollar en el análisis experimental, y preparó la documentación de la investigación.
Declaración de conflictos de interés. No existen conflictos que declarar.
Declaración de financiamientos. No hay fuentes de financiamiento que declarar además del salario devengado por los autores.
Copyright (c) 2021 Alejandro Ramón Hernández, Beatriz Bello García, Marilyn Bello, María Matilde García Lorenzo, Rafael Bello Pérez
Esta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial 4.0 Internacional.