Análise do debate sobre a Covid-19 no Twitter


Autores: Tereza Bernardes, Janaína Guiginski, Ramon Franco, Evandro Cunha, Daniel Silva, Marcelo Ganem, Ana Paula Couto, Wagner Meira Jr.

A ideia deste estudo foi tentar compreender a pandemia enquanto um fenômeno social a partir dos dados que as redes sociais disponibilizam para gente, em especial, o Twitter. O motivo da escolha específica pelo Twitter como rede social se dá pelo fato de ele ser uma rede social que permite uma fácil coleta e análise dos dados, trabalhar com dados oriundos de outras redes sociais acabaria por aumentar imensamente a complexidade do estudo sem trazer um benefício expressivo. Um diferencial notável entre as pandemias que ocorreram no passado e a do novo coronavírus, é o fato de que a última foi, de certa maneira, capturada pelas redes sociais, funcionando como um registro de opiniões, sentimentos e o que elas acham relevante no contexto da pandemia. O resultado disso é uma quantidade massiva de dados que, com um uso inteligente, podem ser aproveitados para entender a relação.

Dito tudo isso, os objetivos da pesquisa foram:

  • Mostrar a repercussão da pandemia.
  • Relacionar o número de “tweets” e “retweets” com os casos da covid-19.
  • Relacionar a ocorrência de palavras-chave com os casos de covid-19 e acontecimentos relevantes em 2020.

Para a realização deste estudo, foram coletados mais de 97 milhões de tweets e retweets. Os critérios para seleção dos tweets e retweets foram os seguintes:

  • Devem estar em língua portuguesa.
  • Estão dentro do intervalo de maio até dezembro de 2020.
  • Devem conter pelo menos uma das palavras-chave. (“corona”, “covid”, “coronavirus”, “covid19”, “quarentena”, “hidroxicloroquina”, “cloroquina”, “confinamento”, “distanciamento social”, “aglomeração”, “aglomerações”, “sars” e “covid-19”)

Aqui temos o primeiro resultado, onde no “eixo y” na direita temos os casos de covid por semana, enquanto que na esquerda temos o número de “tweets” e “retweets”, já no “eixo x” temos o tempo. 

Uma pergunta que gostaríamos de responder é: “Será que a evolução da pandemia implica diretamente num aquecimento do debate na rede?”. Para nossa surpresa, notamos que o número de casos de covid aumenta enquanto que o debate acerca do mesmo tema diminui. Acreditamos que essa relação inversa encontrada é predominantemente explicada pela abordagem utilizada pela mídia de modo geral, ou seja, no início estávamos diante de algo novo, quando somamos o fator curiosidade das pessoas com um grande enfoque dos canais midiáticos, temos os resultados observados no início. Com o passar do tempo, o assunto perde o fator surpresa, o que faz ele se tornar menos relevante nas conversas nestes meios. 

Neste segundo gráfico, temos os “tweets” e “retweets” coletados com as palavras-chave. Gostaríamos de saber se em algum ponto específico na linha do tempo da pandemia ocorreu algum evento que teve um impacto intenso e observável na rede a partir dos dados coletados?

Encontramos alguns eventos interessantes, como por exemplo o mês de julho de 2020, onde acontecimentos políticos muito relevantes fizeram que a relevância do assunto aumentasse na rede:

  • O Brasil atingiu a marca de 2 milhões de infectados.
  • Bolsonaro anunciou estar com Covid e defendeu o uso da cloroquina.
  • Número de tweets contendo a palavra “cloroquina” apresenta novo pico no início de julho.

De fato, é possível observar que os picos geralmente estão atrelados a algum pronunciamento marcante ou algum evento memorável relacionado ao tratamento da pandemia no Brasil. Especificamente no caso do pronunciamento do presidente, percebemos que o fato dele incentivar o uso da cloroquina como meio de tratamento, teve um enorme repercussão dado que isso trouxe à tona um grandes debates como o papel da ciência na sociedade, a importância da revisão de trabalhos científicos, dentre outros relacionados.

Ainda tratando destes dados, temos as ocorrências relativas à quarentena(direita) e as relativas à doença em si (esquerda).

Como pode ser visto no primeiro gráfico o número de absoluto de tweets cai, mas, ao analisar uma ocorrência relativa (no gráfico à direita), vemos que o tópico quarentena tem uma tendência decrescente, enquanto que o oposto é observado no tópico do covid como um todo. Ou seja, apesar do assunto covid se manter relevante, inclusive mostrando uma tendência crescente no subconjunto, alguns sub aspectos como quarentena vão se tornando menos relevantes, podendo ser um indicativo da diminuição da importância que a população, de modo geral, atribui à quarentena. 

Estas foram as três principais análises nesse estudo, mas é importante comentar que este estudo é parte de um projeto ainda maior chamado “Covid Data Analytics”, onde outros estudos como este foram conduzidos e podem ser encontrados no nosso portal: /.

** O presente estudo foi apresentado por Marcelo Ganem no Congresso Brasileiro de Evidências Clínicas e pode ser visualizado na íntegra pelo seguinte link: https://youtu.be/tXzYsB9XZBU?t=1341.