Análise espacial dos casos de covid-19 nas regiões imediatas do Brasil

O geoprocessamento de dados e as análises espaciais podem auxiliar na compreensão de fenômenos complexos, heterogêneos e autocorrelacionados, como é o caso da disseminação do novo coronavírus ao longo do tempo e do território. Este artigo tem o objetivo de investigar a existência de padrões espaciais significativos para os casos de covid-19 e óbitos relacionados, através da Análise Exploratória de Dados Espaciais. Para tanto, são aplicadas as estatísticas I de Moran e LISA a três indicadores epidemiológicos: casos acumulados por 100 mil habitantes, novos casos semanais por 100 mil habitantes e letalidade (razão entre óbitos por covid-19 e casos confirmados da doença). A unidade básica de análise é formada pelas regiões imediatas do Brasil e a análise compreende o período de abril de 2020 a março de 2021.

DADOS E MÉTODOS

Fonte de dados

Como fonte de dados utilizou-se a base de dados disponibilizada pelo Projeto Brasil.io, que fornece dados compilados das 27 Secretarias Estaduais de Saúde de casos e óbitos de covid-19 confirmados por dia para todos os municípios brasileiros. Tal nível de detalhamento territorial e temporal confere grande versatilidade aos dados, que podem assim ser agrupados em diferentes períodos e níveis geográficos. 

Foram calculados três indicadores do avanço da pandemia de covid-19:

  • total de casos por 100.000 habitantes, uma medida aproximada da prevalência da doença;
  • novos casos semanais por 100.000 habitantes, uma medida de incidência da doença;
  • letalidade da covid-19, obtida pela razão entre o total de óbitos e o total de casos confirmados da doença.

A base de dados original foi manipulada, de modo a transformar os valores diários em valores semanais e agregar os municípios em regiões imediatas.

O período de análise divide a pandemia em duas fases. A primeira fase compreende as semanas epidemiológicas desde 12 de abril de 2020 (semana 16/2020) até 08 de agosto de 2020 (semana 32/2020). A segunda fase compreende o período entre 22 de novembro de 2020 (semana 48/2020) a 20 de março de 2021 (semana 11/2021). 

Foi identificada ausência de dados desagregados para os municípios de Mato Grosso de agosto a novembro de 2020 (semanas 33 a 48) e, por isso, este período foi desconsiderado na análise.

Os três indicadores foram calculados por semana epidemiológica, para cada região imediata do Brasil. As regiões imediatas foram selecionadas como unidade de análise por terem uma precisão espacial maior que o nível estadual e, ao mesmo tempo, uma flutuação de dados menor que o nível municipal. 

Método

A Análise Exploratória de Dados Espaciais (AEDE) foi utilizada para verificar a existência de padrões espaciais significativos e a formação de padrões de associação local, classificando as regiões imediatas em grupos homogêneos segundo a variável de interesse.

Autocorrelação Global Univariada — I de Moran

A estatística I de Moran fornece um único valor como medida da associação espacial das regiões, representando a correlação linear do indicador epidemiológico entre as regiões. Quando positivo e significativo, o coeficiente do I de Moran global, indica a presença de correlação positiva, ou seja, regiões com valores altos para o indicador tendem a se agrupar no espaço, assim como regiões com valores baixos tendem a formar agrupamentos com regiões semelhantes.

Autocorrelação Local Univariada — LISA 

As estatísticas LISA (Local Indicators of Spatial Association) fornecem um valor para cada região, permitindo identificar agrupamentos espaciais significativos. Para identificar estes agrupamentos, utiliza-se o diagrama de dispersão de Moran e o mapa de clusters. O mapa de clusters combina a significância das medidas de associação local — o mapa de significância — com as informações do diagrama de dispersão. O diagrama de dispersão informa a medida global de associação linear — I de Moran (representado pela reta de regressão) — e o tipo de associação linear para cada observação. São quatro tipos possíveis de associação espacial linear: Alto-Alto, Baixo-Baixo, Alto-Baixo e Baixo-Alto. 

Visualização

As análises consideraram 3 indicadores epidemiológicos e 32 semanas epidemiológicas, gerando 102 mapas de clusters. Com o propósito de condensar a informação, para cada indicador epidemiológico, foram construídos dois mapas de cluster LISA, que representam a primeira e a segunda fase da pandemia no Brasil. Estes mapas apresentam o tipo de cluster que predominou nas regiões imediatas durante o período em questão. Para facilitar a visualização, foram considerados apenas os clusters do tipo Alto-Alto e Baixo-Baixo.

As regiões em vermelho indicam a predominância de clusters do tipo Alto-Alto — regiões com valores altos para o indicador epidemiológico em análise rodeadas por vizinhos com valores altos. Em azul, estão representados os clusters do tipo Baixo-Baixo — regiões com baixos valores rodeadas por vizinhos com baixos valores para um mesmo indicador epidemiológico. A intensidade das cores indica quantas vezes a região integrou aquele agrupamento.

RESULTADOS

Foram produzidos dois mapas para cada um dos indicadores epidemiológicos — total de casos por 100.000 habitantes, novos casos semanais por 100.000 habitantes e letalidade. As regiões imediatas predominantemente classificadas como clusters do tipo Alto-Alto estão representadas em vermelho; em azul, as regiões predominantemente classificadas como Baixo-Baixo; em cinza, estão as regiões sem autocorrelação espacial significativa ou com predominância de autocorrelações negativas (Alto-Baixo e Baixo-Alto).

Casos acumulados por 100.000 habitantes

Os mapas de clusters para o indicador de casos acumulados por 100.000 habitantes estão dispostos na Figura 1. Antes de avaliar os mapas, é importante considerar que esse indicador é calculado cumulativamente com base no número total de casos dividido pela população e multiplicado por 100.000. O valor de uma semana é sempre condicionado e superior ao valor da semana anterior. Logo, é esperado que o número de ilhas cuja autocorrelação espacial seja significativa diminua com o tempo. Isso porque à medida que o indicador se aproxima de 100.000 (seu próprio denominador), espera-se que as variações semanais dos casos acumulados sejam cada vez menores. Seu valor torna-se cada vez mais condicionado por ele mesmo na semana anterior e menos pelos valores das regiões vizinhas.

Figura 1 — Mapa de clusters para casos acumulados por 100.000 hab. Brasil, 2020–2021

Observa-se redução dos agrupamentos com autocorrelação espacial significativa ao longo do tempo. Algumas regiões chamam a atenção pela persistência dos agrupamentos Baixo-Baixo e Alto-Alto. Um exemplo de persistência no agrupamento do tipo Baixo-Baixo é região da bacia do Rio São Francisco. Possível explicação pode ser encontrada no fato de que a região é formada por cidades de pequeno e médio porte, pouco integrada à malha rodoviária federal, com menor tráfego de pessoas e, consequentemente, baixa taxa de transmissão do coronavírus. O sul de Minas Gerais também aparece com clusters do tipo Baixo-Baixo predominando nas duas fases.

Em contrapartida, na maioria dos estados da região Norte (Acre, Amapá, Amazonas, Rondônia e Roraima) observa-se predominância de clusters do tipo Alto-Alto. O Norte é uma região de alto risco, com população mais jovem e em piores condições socioeconômicas (Lima et al., 2021). Além disso, o surgimento de uma nova cepa mais transmissível do coronavírus em Manaus pode ter contribuído para o agravamento da situação nesta região. 

As regiões imediatas dos estados do Mato Grosso e Santa Catarina, na primeira fase da pandemia, eram regiões com baixa concentração de casos, mas tornaram-se regiões de alta concentração. O surgimento de clusters Alto-Alto também é observado no norte do Tocantins e no Espírito Santo, ponto que será abordado na próxima subseção, a partir dos mapas de incidência.

Por sua vez, nas regiões próximas a Belém (PA) e São Luís (MA) observa-se o surgimento de clusters Baixo-Baixo, em substituição aos Alto-Alto. Como possível explicação, destacamos que estes estados estabeleceram medidas de isolamento mais rígidas no começo da pandemia. O Maranhão, por exemplo, foi o primeiro estado no país a decretar lockdown, em 5 de maio de 2020. Isso pode ter reduzido a circulação de pessoas e, consequentemente, a propagação do vírus.

Novos casos semanais por 100.000 habitantes

Os mapas da Figura 2 indicam os clusters formados pelo indicador de incidência da covid-19 nas duas fases da pandemia. Assim como o indicador de casos acumulados, a incidência também é relativa à população; porém, não é cumulativa. Ou seja, os novos casos semanais por 100.000 habitantes podem aumentar ou diminuir de uma semana para a outra sem estarem, necessariamente, relacionados com os valores registrados na semana anterior. Esta autocorrelação temporal não deixa de estar presente neste indicador, mas atua em um grau muito inferior aos indicadores de prevalência e letalidade. 

Figura 2— Mapa de clusters para novos casos semanais (incidência) por 100.000 hab. Brasil, 2020–2021

Primeiramente, pode-se observar que, na primeira fase da pandemia, o mapa de incidência (Figura 2) não difere muito do mapa de casos acumulados da Figura 1. Isso ocorre porque o indicador de casos acumulados pode ser interpretado como um valor acumulado da incidência, assim, ambos os indicadores tendem a ser mais semelhantes no início do período. Enquanto o total de casos informa sobre o efeito acumulado da doença no decorrer da pandemia, a incidência descreve o impacto imediato dela. Na segunda fase, é visível a neutralização de alguns e a intensificação de outros clusters

Entre a primeira e a segunda fase da pandemia, observa-se uma mudança no eixo geográfico da incidência. Na primeira fase, a pandemia afligiu muito mais e com muito mais força o eixo Norte-Nordeste (leste-oeste), regiões com população mais jovem e em pior situação socioeconômica, em relação ao restante do país. Na segunda fase, o Nordeste passou a ser uma região menos afetada, com predominância de clusters do tipo Baixo-Baixo para o indicador de novos casos. As regiões Norte, Centro Oeste e Sul passaram a ser mais afetadas, com agrupamentos significativos de localidades com alta incidência de casos, formando um eixo mais inclinado, na direção norte-sul. 
O estado do Espírito Santo, durante todo o período, permanece como uma região de alta incidência.

Na segunda fase da pandemia, o estado de Minas Gerais chama a atenção por formar um caminho da ilhas Alto-Alto que corta o estado em várias direções. Estas ilhas situam-se às margens da BR 381, que liga São Paulo ao Espírito Santo, passando por Belo Horizonte e Governador Valadares; da BR 262, que passa por Uberaba e Belo Horizonte e leva a Vitória, no Espírito Santo. O caminho identificado também conta com a influência da BR 356 e BR 354, que ligam o Distrito Federal e Goiás ao estado do Rio de Janeiro. Além disso, a região conta também com ferrovias, que conectam Uberlândia, Belo Horizonte e Vitória. 

Em perspectiva mais ampla, pode-se notar um caminho de clusters Alto-Alto de novos casos que parte do Mato Grosso, passa pela porção inferior do estado de Goiás e pelo caminho já citado em Minas Gerais, chegando ao Espírito Santo. Em outras palavras, existe um conjunto de clusters com alta incidência de casos que se sobrepõe às regiões imediatas pertencentes ao Corredor Sudeste (Eixo Vitória) de exportação da soja e milho. 

Letalidade da doença

Os mapas de clusters para a letalidade estão dispostos na Figura 2.5. O indicador de letalidade é calculado como a razão entre os óbitos acumulados e os casos acumulados. Assim como o indicador de prevalência, a letalidade também é calculada de maneira cumulativa; logo, a maior parte das colocações feitas para a prevalência também vale para a letalidade. Mas, enquanto o indicador de prevalência sempre aumenta e tende à estabilidade à medida que se aproxima de 100.000 (caso em que quase toda a população terá sido infectada), a letalidade pode aumentar ou diminuir e tende a se estabilizar em diferentes níveis, dependendo da região.

O aumento ou decréscimo da letalidade reflete a relação entre o número de óbitos e casos registrados e qualquer mudança em um ou em outro altera seu valor. Como este indicador tende a se estabilizar com o passar do tempo, a análise dos clusters na segunda fase da pandemia é mais interessante. 
Ao comparar as duas fases da pandemia, quase não se registra o surgimento de novos clusters no segundo período, sendo mais comum a filtragem de regiões e a intensificação das cores representadas no mapa. Observa-se também que não há casos de inversão de predominância, isto é, nenhuma região que possuía uma classificação predominantemente Alta se tornou uma região de predominância Baixa, e vice-versa.

Observação curiosa é que as regiões que formaram clusters Alto-Alto de letalidade — Pantanal no Mato Grosso do Sul, Ribeirão Preto e litoral sul de São Paulo, Rio de Janeiro e litoral do Rio Grande do Norte — não apresentaram agrupamentos significativos para o indicador de casos acumulados. Uma exceção é observada no literal de Pernambuco, que apresentou cluster Baixo-Baixo para total de casos e cluster Alto-Alto para letalidade, o que pode estar relacionado a um baixo nível de testagem de casos suspeitos nesta região, hipótese que merece mais investigação.

Algumas regiões com baixa letalidade (Figura 2.5) pertencem a agrupamentos com valores altos para casos acumulados (Figura 2.3). Este é o caso do Acre, oeste do Amazonas, Amapá, norte do Tocantins e praticamente todo o estado de Santa Catarina. Isto indica que o aumento no total de casos tem sido, em média, proporcionalmente superior ao aumento do número de óbitos. Ou seja, estes agrupamentos com baixa letalidade são também agrupamentos com alta prevalência de casos acumulados.

E, finalmente, é interessante destacar o interior da Bahia, que apresenta clusters do tipo Baixo-Baixo tanto para os indicadores de casos, novos ou acumulados, quanto para a letalidade nas duas fases da pandemia.

Figura 3 — Mapa de clusters para a letalidade da covid-19. Brasil, 2020–2021