The Biologist
(Lima)
The Biologist (Lima), 2020, 18(2), jul-dec: 171-184.
ORIGINAL ARTICLE / ARTÍCULO ORIGINAL
1*Centro Meteorológico Provincial de Villa Clara, Cuba. E-mail: ricardo.oses@vcl.insmet.cu
2 Departamento de Enfermedades Transmisibles, Unidad Municipal de Higiene y Epidemiología de Santa Clara, Villa Clara,
Cuba. E-mail: liah140613@nauta.cu
3 Facultad de Tecnología de la Salud y Enfermería (FTSE). Universidad de Ciencias Médicas de Villa Clara (UCM-VC),
Cuba. E-mail: rigobertofd@infomed.sld.cu
4
EmpresaConstrutora de la Industria Eléctrica de Villa Clara (ECIE)
5Laboratorio de Ecología y Biodiversidad Animal (LEBA). Facultad de Ciencias Naturales y Matemáticas (FCNNM).
Universidad Nacional Federico Villarreal (UNFV). El Agustino, Lima, Perú.
6Facultad de Ciencias Biológicas. Universidad Ricardo Palma (URP). Santiago de Surco, Lima, Perú.
E-mail: joseiannacone@gmail.com
*Corresponding author: ricardo.oses@vcl.insmet.ci
1* 2 3 4
Ricardo Osés-Rodríguez ; Claudia Osés-Llanes ; Rigoberto Fimia-Duarte ; Alfredo González-Meneses & José
5,6
Iannacone
ABSTRACT
Keywords: COVID-19 – Cuba – mathematical models – pandemic – Regressive Objective Regression – Villa Clara
The COVID-19 pandemic affecting planet earth has had a peculiar development in Cuba. The objective of
the research was to model, using the Regressive Objective Regression (ROR) methodology, a set of
parameters (confirmed cases, severe, critical and deaths) inherent to the SARS CoV-2 (COVID-19)
pandemic, so far in 2020 in Cuba. The parameters analyzed were: deaths, serious and critical cases, as well
as confirmed cases in the municipality of Santa Clara, Villa Clara province and Cuba. Mathematical
models were obtained through ROR methodology that explain the behaviour of these cases, depending on
the variable to be studied, 6, 4, 10 and 14 days in advance. This made it possible to make long-term
forecasts, allowing measures to be taken in clinical services, and thus avoiding and reducing the number of
deaths and complications in patients. It is concluded that COVID-19, despite being a new disease in the
world, can be followed by means of ROR mathematical modeling, which allows to reduce the number of
dead, serious and critical patients for a better management of the pandemic.
The Biologist (Lima)
ISSN Versión Impresa 1816-0719
ISSN Versión en linea 1994-9073 ISSN Versión CD ROM 1994-9081
doi:10.24039/rtb2020182754
171
The Biologist
(Lima)
VOL. 18, Nº 2, JUL-DEC 2020
The Biologist (Lima)
Versión en Linea:
ISSN 1994-9073
Versión Impresa:
ISSN 1816-0719 Versión CD-ROM:
ISSN 1994-9081
PUBLICADO POR:AUSPICIADO POR:
ESCUELA PROFESIONAL DE BIOLOGÍA,
FACULTAD DE CIENCIAS NATURALES Y MATEMÁTICA,
UNIVERSIDAD NACIONAL FEDERICO VILLARREAL
PROGNOSIS OF COVID-19 THROUGH REGRESSIVE OBJECTIVE REGRESSION METHODOLOGY
IN VILLA CLARA AND CUBA
PRONOSTICO DE LA COVID-19 POR MEDIO DE LA METODOLOGÍA DE REGRESIÓN OBJETIVA
REGRESIVA EN VILLA CLARA Y CUBA
The Biologist (Lima). Vol. 18, Nº2, jul - dec 2020
RESUMEN
Palabras clave: COVID-19 – Cuba – modelos matemáticos – pandemia – Regresión Objetiva Regresiva – Villa Clara
La pandemia del COVID-19 que afecta al planeta tierra ha tenido un desarrollo peculiar en Cuba. El
objetivo de la investigación consistió en modelar mediante la metodología de la Regresión Objetiva
Regresiva (ROR) un conjunto de parámetros (casos confirmados, graves, críticos y fallecidos) inherentes
a la pandemia SARS CoV-2 (COVID-19), en lo que va del año 2020 en Cuba. Los parámetros analizados
fueron: casos fallecidos, los graves y los críticos, así como los casos confirmados del municipio Santa
Clara, provincia Villa Clara y Cuba. Se obtuvieron modelos matemáticos mediante la metodología ROR
que explican el comportamiento de los mismos, dependiendo estos de 6, 4,10 y 14 días de antelación en
dependencia de la variable a estudiar, lo cual posibilitó realizar pronósticos a largo plazo, permitiendo
tomar medidas en los servicios clínicos, y así evitar y disminuir el número de fallecidos y complicaciones
en los enfermos. Se concluye que la COVID-19 pese a ser una enfermedad nueva en el mundo puede ser
seguida mediante la modelación matemática ROR, esto permite disminuir la cantidad de pacientes
fallecidos, graves y críticos para un mejor manejo de la pandemia.
INTRODUCCIÓN
172
Desde los comienzos de la civilización, las
enfermedades infecciosas han afectado a los
humanos (Gubler, 2002; Bangs et al., 2006; Yang et
al., 2020). La historia temprana de estas
enfermedades se caracterizó por brotes súbitos e
impredecibles, con frecuencia de proporciones
epidémicas (Lambrechts et al., 2010; Gould et al.,
2017; Abdullah et al., 2020), por lo que la situación
actual que está viviendo el planeta a causa del
nuevo coronavirus, es un desencadenante más,
producto de múltiples factores, con una alta cuota
derivada de la actividad antropogénica (Fimia et
al., 2015; Osés et al., 2017b). Se han descrito dos
grandes epidemias, el síndrome respiratorio agudo
grave por coronavirus (SARS-CoV) en el 2002 y el
síndrome respiratorio de Oriente Medio
(MERSCoV) en el 2012, hasta que en diciembre
del 2019 apareció en China el SARS-CoV-2 o
COVID-19 (del inglés “Enfermedad por Infección
por Coronavirus”), que en lo sucesivo será
denominado en este artículo como coronavirus
(Fan et al., 2019; Prem et al., 2020; Salas et al.,
2020; Sun et al., 2020).
Los coronavirus pertenecen a la familia
Coronaviridae. El tamaño de los genomas varía
entre 26 a 32 kilonucleótidos, siendo uno de los
virus de tipo ARN positivos de mayor tamaño
(Marín et al., 2020; Zheng, 2020). Tienen una
nucleocápside de simetría helicoidal con una
envoltura que tiene unas estructuras glicoproteicas
que parecen una corona de puntas (por ello se les ha
llamado coronavirus). El virus puede medir de 120
a 160 nm de diámetro (Cortellis, 2020; Wang et al.,
2020).
Los coronavirus pueden producir enfermedades
respiratorias y digestivas, tanto en aves como en
mamíferos, incluyendo al hombre, en el cual
pueden producir enfermedades, desde un resfriado
común a cuadros más severos como bronquitis,
bronquiolitis y neumonía (Khan et al., 2020;
Singhal, 2020). Los síntomas más frecuentes son
los respiratorios (Singhal, 2020; Yi et al., 2020); al
inicio hay fiebre (se presenta en más del 90% de
casos), seguida de tos seca (70%). También son
frecuentes al inicio de los síntomas los dolores
musculares (mialgias), dolor de cabeza, sensación
de fatiga o cansancio (40%) y síntomas digestivos,
como vómitos o diarreas (Fang et al., 2020; Huang
Osés-Rodríguez et al.
173
al., 2020; Roosa et al., 2020; Zhao & Chen, 2020;
Zhao et al., 2020ab). En virtud de ello es
importante estimar la tendencia en el
comportamiento de la curva epidemiológica de la
pandemia COVID-19 (Saez et al., 2020; Zhao &
Musa, 2020; Zhao et al., 2020ab).
El objetivo del estudio consistió en modelar
matemáticamente un conjunto de parámetros de la
pandemia COVID-19, entre ellos, los casos
confirmados en el municipio Santa clara, así como
los fallecidos, graves y los críticos en Cuba, de tal
manera que se tenga una antelación suficiente que
le permita a los médicos que tratan con estos
pacientes tomar decisiones oportunas y salvar
vidas.
En el trabajo se utilizaron los datos de la pandemia
de casos fallecidos, graves y críticos para Cuba y
los casos confirmados para el municipio Santa
Clara, provincia Villa Clara (Fig. 1).
El pronóstico se realizó con el uso de la
metodología de Regresión Objetiva Regresiva
(ROR) que ha sido implementada en diferentes
variables como los virus y bacterias que circulan en
la provincia Villa Clara (Osés et al., 2017abcd;
Sánchez et al., 2017).
La modelación Objetiva Regresiva (ROR), se basa
en una combinación de variables Dummy con
modelación ARIMA, donde se crean dos variables
Dummy solamente y se obtiene la tendencia de la
serie, requiere de pocos casos para ser utilizada y
permite utilizar también, variables exógenas que
posibilitan modelar y pronosticar a largo plazo, en
dependencia de la variable exógena, ha dado
mejores resultados que la ARIMA en algunas
variables, como son la modelación de VIH,
entidades de etiología viral/arbovirosis y entidades
parasitarias (Osés & Grau, 2011; Fimia et al., 2015;
Osés et al., 2017abc).
En la metodología ROR, se crean en un primer
paso, variables dicotómicas DS, DI y NoC, donde:
NoC: Número de casos de la base,
et al., 2020). Menos frecuente parece ser el dolor de
garganta. Debido a que otras enfermedades
respiratorias pueden presentar síntomas similares,
es importante que el paciente informe de posibles
contactos con enfermos o personas que hayan
estado en zonas que se hayan identificado como
lugares con alta frecuencia de coronavirus (Wu &
Mc. Googan, 2020). El monitoreo y comunicación
con el equipo médico es fundamental, para detectar
tempranamente la dificultad respiratoria (Wu et al.,
2020).
El nuevo coronavirus (2019-nCoV) identificado el
31 de diciembre de 2019 en Wuhan, China,
actualmente oficializado como SARS-CoV2,
produce la COVID-19. Además, este virus es el
primero de su familia que ha sido declarado
pandemia por la Organización Mundial de la Salud
(OMS) el 11 de marzo de 2020 (OMS, 2020). Los
estudios epidemiológicos mundiales del
coronavirus (CoV) durante 15 años han
demostrado que los murciélagos de Asia, Europa,
África, América y Australia albergan una amplia
variedad de virus, que abrigan y diseminan estos
agentes infecciosos con bastante facilidad,
aumentando su capacidad de transmisión (Fang et
al., 2019; Wang et al., 2019; Woo & Lau, 2019).
Según el Grupo de Investigación Modelos
Matemáticos en Ciencia y Tecnología: Desarrollo,
Análisis, Simulación Numérica y Control
(MOMAT) del Instituto de Matemáticas
Interdisciplinarias de la Universidad Complutense
de Madrid, España, la aplicación del modelo Be-
CoDiS (Between-Countries Disease Spread) en el
análisis de la pandemia COVID-19 proyecta
numéricamente, que este fenómeno viral estará
presente durante un prolongado espacio de tiempo
en el mundo (Ivorra & Ramos, 2020).
Se han aplicado varios modelos y metodologías en
el estudio, análisis y modelación de la COVID-19
en el mundo, donde resaltan: Ecuación Diferencial
Ordinaria de Primer Orden (EDOPO), tipo lineal;
Simple linear Regression model; Generalized
Logistic Growth Model (GLM) ; S t r u c t u r e d
Susceptible-Exposed-Infected-Removed
(SEIR)/SEIR model; el Modelo Matemático de
Probabilidad Bayesiana; SIRD model (también
empleado en Cuba); Modelo Conceptual y el
Modelo de Simulación, entre otros tantos (Rue et
al., 2017; Simpson et al., 2017; Anastassopoulou et
MATERIALES Y MÉTODOS
The Biologist (Lima). Vol. 18, Nº2, jul - dec 2020
COVID-19 in Villa Clara and Cuba
174
el 69 % eran casos activos y el 36 % casos cerrados.
Todo el análisis se realizó con la ayuda del paquete
estadístico SPSS, Versión 19,00, de la compañía
IBM.
Aspectos éticos
La investigación estuvo sujeta a normas éticas,
donde toda la información recopilada y brindada se
utilizó solo con la finalidad declarada. No implicó
afectaciones físicas, ni psicológicas, para de esta
forma, poder generar nuevos conocimientos sin
violar los principios éticos establecidos para estos
casos. Por otra parte, todos los autores
involucrados en la investigación, publicación y
difusión de los resultados, somos responsables de
la confiabilidad y exactitud de los resultados
mostrados (DHAMM, 2013).
A continuación (Fig. 2), se reflejan los datos de
fallecidos en Cuba en la pandemia de COVID-19
según padecimientos de salud anteriores, donde el
mayor porciento de fallecidos lo constituyó, la
Hipertensión arterial, seguido de la Diabetes
mellitus.
DS = 1, si NoC es impar; DI = 0, si NoC es par,
cuando DI=1, DS=0 y viceversa.
Posteriormente se ejecuta el módulo
correspondiente al análisis de Regresión del
paquete estadístico SPSS versión 19.0 (Compañía
IBM, 2010), específicamente el método ENTER
donde se obtiene la variable pronosticada y el
ERROR.
Luego se obtendrán los autocorrelogramas de la
variable ERROR, con atención a los máximos de
las autocorrelaciones parciales significativas
PACF. Se calculan entonces las nuevas variables
atendiendo al Lag significativo del PACF.
Finalmente, se incluyen en la nueva regresión estas
variables regresadas en un proceso de
aproximaciones sucesivas hasta la obtención de un
ruido blanco en los errores de la regresión.
Las corridas de los datos están hechas hasta el día
23 de abril del 2020, según datos tomados del
trabajo publicado en el periódico local de Villa
Clara (Vilches, 2020), quien a su vez usó la fuente
del Ministerio de Salud de Cuba (MINSAP). Hasta
la fecha de la investigación, había 3 393 personas
ingresadas en hospitales para vigilancia clínico-
epidemiológica al COVID-19; se vigilaban en sus
hogares desde la atención primaria de salud 6 727
personas, con 1 283 casos confirmados con el virus,
RESULTADOS
Figura 1. Mapa político administrativo de la provincia Villa Clara y Cuba.
The Biologist (Lima). Vol. 18, Nº2, jul - dec 2020
Osés-Rodríguez et al.
175
que mayor por ciento reporta, seguido del grupo de
más de 80 años (Fig. 3).
En relación con el porciento de fallecidos por
grupos de edades, resultó ser, el grupo de 60 a 79 el
0
10
20
30
40
50
60 53,06
34,69
28,57 26,53
20
12,24
2,04
Figura 2. Datos de fallecidos en Cuba en la pandemia de COVID-19, según padecimientos de salud anteriores.
0
5
10
15
20
25
Mas de 80
años
DE 60 a 79
años
DE 40 a 59
años
DE 20 a 39
años
Menos de
29 años
20 22
5
20
Figura 3. Fallecidos en Cuba por COVID-19 según grupos etarios.
En la tabla 1 se explica el 88,9 % de los fallecidos
para Cuba con un error de 1,14 casos.
Resultados de los fallecidos, graves y casos
críticos con su pronóstico para los próximos días
Según la metodología ROR
Tabla 1. Modelo ROR de fallecidos en Cuba.
Resumen del modeloc,d
Modelo
R
R cuadradob
R cuadrado
corregida
Error típ. de la
estimación
Durbin-
Watson
1 0,88a
0,79 0,75 1,14 1,97
a. Variables predictoras: Lag14Fallecidos, DI, DS, NoC
b. Para la regresión a través del origen (el modelo sin término de intersección), R cuadrado mide la proporción de la variabilidad de la variable
dependiente explicado por la regresión a través del origen. NO SE PUEDE comparar lo anterior con la R cuadrado para los modelos que incluyen
una intersección.
c. Variable dependiente: Fallecidos.
d. Regresión lineal a través del origen.
The Biologist (Lima). Vol. 18, Nº2, jul - dec 2020
COVID-19 in Villa Clara and Cuba
Hipertención arterial
Sin morbilidades previas
El modelo de casos graves depende de los casos
seis días atrás (Lag6Graves) y presenta una
tendencia al aumento, aunque no significativa
En el caso de los pacientes graves, el modelo
explica el 96,4 % de la varianza con un error de 1,98
casos (Tabla 4).
176
valor tiene un valor negativo, lo que indica que de
14 días hasta ahora, la tendencia de fallecidos es
negativa o sea a la disminución, lo que indica que
los procederes en las salas de atención de estos
pacientes es altamente valorada.
En la tabla 2 se aprecia el modelo obtenido según
ROR, la tendencia es positiva significativa al 99 %,
los demás parámetros aportan varianza explicada
al modelo, aunque no son significativos. Este
modelo depende de los fallecidos 14 días atrás, y el
Tabla 2. Coeficientes del modelo ROR de Fallecidos para Cuba.
Coeficientesa,b
Modelo
Coeficientes no estandarizados Coeficientes
tipificados t Sig.
B
Error típ. Beta
1 DS
-0,63
0,86 -0,19 -0,73 0,47
DI
-1,27
0,91 -0,40 -1,39 0,17
Tendencia
0,11
0,03 1,57 3,46 ,002
Lag14Fallecidos
-0,62
0,26 -0,41 -2,31 0,03
a. Variable dependiente: Fallecidos.
b. Regresión lineal a través del origen.
altibajos que el modelo describe con certeza.A continuación, se realizó un pronóstico de los
fallecidos (Fig. 4), como se observa existen
Figura 4. Pronostico de fallecidos para los próximos 14 días.
The Biologist (Lima). Vol. 18, Nº2, jul - dec 2020
Osés-Rodríguez et al.
a. Variables predictoras: Lag6Graves, DI, DS, NoC.
b. Para la regresión a través del origen (el modelo sin término de intersección), R cuadrado mide la proporción de la variabilidad de la variable
dependiente explicado por la regresión a través del origen. NO SE PUEDE comparar lo anterior con la R cuadrado para los modelos que incluyen
una intersección.
c. Variable dependiente: Graves.
d. Regresión lineal a través del origen.
177
tomar medidas en los hospitales que atiende este
grupo de casos.
En la figura 5 se aprecia el pronóstico de casos
graves para los próximos seis días, se nota un ligero
aumento en los próximos días lo que conlleva a
Tabla 4. Resultados del modelo para casos graves en Cuba por COVID-19.
Resumen del modeloc,d
Modelo
R
R cuadradob
R cuadrado
corregida
Error típ. de la
estimación
Durbin-
Watson
1 0,96a
0,93
0,91 1,98 1,23
Tabla 5. Modelo de casos graves en Cuba por COVID-19.
Coeficientesa,b
Modelo
Coeficientes no estandarizados Coeficientes
tipificados t Sig.
B
Error típ. Beta
1 DS
6,01
3,60 0,65 1,66 0,11
DI
4,85
3,71 0,50 1,30 0,21
Tendencia
0,07
0,12 0,43 0,61 0,55
Lag6Graves
-0,33
0,29 -0,31 -1,13 0,27
a. Variable dependiente: Graves.
b. Regresión lineal a través del origen.
los datos dentro de cierto rango.(Tabla 5). Como se sabe DS y DI son parámetros
que describen los altibajos de la serie y mantienen
Figura 5. Pronostico de graves por COVID-19 para los próximos seis días.
The Biologist (Lima). Vol. 18, Nº2, jul - dec 2020
COVID-19 in Villa Clara and Cuba