Seguimiento de casos confirmados de SARS-CoV-2 en México

Nota: Los conteos de casos confirmados no pretenden contar todos los casos, y nunca lo han pretendido. Son una herramienta que brinda información sobre el comportamiento y evolución de la pandemia.

Indicadores varios

La tasa de cambio diaria refleja la proporción que representa el dato acumulado de un día, respecto del día anterior.

Mientras más alto sea el valor, mayor la aceleración en el crecimiento. Un crecimiento nulo queda representado con el valor de 1.0.

La gráfica adyacente muestra las posibles diferencias en la velocidad de crecimiento de los casos confirmados y los decesos confirmados.

Estas gráficas no son un pronóstico confiable, y son altamente especulativas.

Su propósito es servir de guía visual para identificar la fase actual de la campana de casos diarios, según se puede deducir de los datos y tendencias actuales.

Se calculan como el conjunto de los diferenciales de la función que mejor ajusta a los casos acumulados hasta la fecha, evaluada cada día.

Se actualizarán diariamente conforme surjan más datos, y se mantendrán mientras tengan sentido.

Gráfica con pico forzado al día 77 (15-may-2020)

Pronóstico a 5 días

¿De dónde vienen los datos?

Los datos de obtienen de las cifras oficiales proporcionadas por la Secretaría de Salud mexicana.

Fuente: https://coronavirus.gob.mx/

¿Cómo se obtiene el pronóstico?

Se obtiene al ajustar un modelo que pueda reflejar el comportamiento del fenómeno que pretendemos analizar. En este caso, la propagación de una epidemia.

El ajuste se realiza sobre dos modelos bien diferenciados, eligiéndose a cada momento el que muestre menor error en dicho ajuste. La medida de error empleado es el clásico error cuadrático medio.

Los modelos empleados para el ajuste son muy sencillos, de propósito general. Estos son:

Modelo Richard

La ecuación logística general.

\(f(x) = \frac{d}{(1 + a e^{-b(x - c)})^{1 / a}}\)

Modelo Gompertz

\(f(x) = ae^{-e^{-b(x-c)}}\)

Una de las varias variantes de la función de Gompertz, orientada a expresar todo tipo de crecimientos. Basada en la función logística.

Método de ajuste

El ajuste se realiza aplicando un algoritmo genético a fin de encontrar los parámetros del modelo que minimizan el error. Se utiliza el lenguaje Python 3 para ejecutar dicho algoritmo, utilizando una biblioteca de autoría propia (no disponible públicamente por ahora).

El algoritmo tiene las siguientes características:

  • El genoma es codificado como una cadena binaria que representa los valores de los parámetros como números de punto fijo. La cantidad de bits destinados a la parte entera y la mantisa se ajustan previamente para cada parámetro, en función del valor esperado para dicho número, a fin de reducir el espacio de búsqueda lo más posible.
  • Emplea elitismo parcial.
  • Cruza utilizando un esquema de dos puntos de corte.
  • La  elección de parejas es determinista, eligiendo para la cruza el mejor individuo disponible en la población que no haya sido cruzado aún, con el peor que tampoco haya sido cruzado, hasta agotar las cruzas posibles.
  • Para la generación siguiente son elegidos de forma determinista sólo los mejores individuos.
  • La tasa de mutación es variable, oscilando senoidalmente entre cero y un valor máximo establecido, a lo largo de diversas generaciones, y se refiere a la probabilidad que tiene un bit de ser modificado.

El algoritmo utilizado es una modificación del mencionado en:

Morales, A. K., Quezada, C. V., Lindavista, C., & México, D. (1998). A universal eclectic genetic algorithm. In Proc. 6th Iberoamerican Conf. Artif. Intell. (pp. 1-14).

Aplicando la técnica de penalización para las restricciones (cuando se utilizan) sugerido en:

Kuri-Morales, A. F., & Gutiérrez-García, J. (2002, April). Penalty function methods for constrained optimization with genetic algorithms: A statistical analysis. In Mexican international conference on artificial intelligence (pp. 108-117). Springer, Berlin, Heidelberg.

Los parámetros del algoritmo genético son:

  • 20,000 individuos.
  • 3,000 generaciones.
  • Probabilidad de cruza de 0.3.
  • Tasa de mutación máxima de 0.1. El ciclo de la tasa de mutación es de 100 generaciones.
  • El elitismo es al 50% de la población.

¿Cómo deben ser interpretados los datos?

Los conteos de casos confirmados no pretenden contar todos los casos, y nunca lo han pretendido. Son una herramienta que brinda información sobre el comportamiento y evolución de la pandemia.

Tampoco son números comparables entre distintos países, dado que se han adquirido de formas diferentes.

Una analogía con canicas

Imagina que cada país es una piscina llena de canicas negras y blancas. Cada piscina es de diferente tamaño. Unas son muy pequeñas, y otras muy grandes o medianas. Pero todas diferentes.

Piscinas

Los dueños quieren saber cuántas canicas blancas hay en su piscina, pero no pueden sacarlas todas. Como están revueltas, deciden sacar canicas con una cubeta para contarlas, y ver que proporción de ellas es blanca.

Como sabes cuantas canicas hay en total, puedes estimar la cantidad de canicas blancas en tu piscina. Regla de tres. Unos países tienen una cubeta grande, y pueden sacar muchas. Otros apenas tienen un recipiente pequeño.

El tamaño del recipiente no está relacionado con el tamaño de la piscina. Pregunta: ¿Crees que es útil comparar el número en bruto de canicas blancas de cada recipiente?

¡No! Porque no tiene nada que ver con el verdadero número de canicas blancas de cada piscina, ni de su tamaño, ni de nada. El número de canicas blancas en el recipiente no importa, sólo la información que se extrae de él.

Lo que importa es cómo va cambiando el número de canicas blancas cada que metes la cubeta.

Pero hay más, y esto tiene que ver con la dinámica de la epidemia: si sacas muchas «canicas» desde el principio, para que tu muestra represente y refleje la dinámica del evento, tendrás que sacar más adelante un número bestial de pruebas al día, que quizá no te puedas permitir.

Al final te verás rebasado y tu número no reflejará el evento, tan sólo tu capacidad para hacer pruebas, y se volverá inútil.

Cada país usa la cubeta que tiene a la mano como mejor puede aprovecharla. Calcula, estima, decide como usarla en función de lo que él puede hacer, y cómo puede aprovecharla al máximo. ¡Hasta la velocidad a la que puedes contar importa!

La información que se presenta aquí, intenta mostrar la evolución del evento, en tanto que los datos sean confiables. No lo olvides.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *