English French German Spain Italian Dutch
Russian Portuguese Japanese Korean Arabic Chinese Simplified

Rastreando o discurso das mídias sociais sobre a pandemia do COVID-19: desenvolvimento de um conjunto de dados públicos do Twitter sobre coronavírus

DUARTE, Rosália

CHEN, Emily; LERMAN, Kristina; FERRARA, Emilio. Tracking Social Media Discourse About the COVID-19 Pandemic: Development of a Public Coronavirus Twitter Data Set. JMIR Public Health Surveill, v. 6, n. 2 p. e19273, Apr-Jun. 2020. [Publicado online em maio de 2020]. Doi: 10.2196/19273. Disponível em https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7265654/

Durante a pandemia relacionada à COVID -19, grande parte das opiniões, diálogos, recomendações governamentais e informações (verdadeiras e falsas) sobre o tema circulam pelo Twitter. O artigo relata estudo que reuniu, catalogou e analisou postagens dessa rede social sobre o tema, buscando contribuir para rastrear a circulação de desinformação e de afirmações não comprovadas.  

Antes da pandemia relacionada à Covid-19, as redes sociais online já eram o espaço preferencial de comunicação interpessoal e de obtenção de informações para a maioria da população do planeta. Os autores argumentam que as medidas de distanciamento social, necessárias à redução de novas infecções pelo vírus, adotadas em mais de 180 países, elevaram exponencialmente o acesso a essas redes e as tornaram centrais para o diálogo em fórum público, a circulação de opiniões, a veiculação de informações e recomendações sobre prevenção. Através da interface de programação de aplicativos aberta (API) do Twitter, foram rastreadas palavras-chave e contas relacionadas à COVID -19, entre 21 de janeiro e 21 de março de 2020, reunindo mais de 72 milhões de tweets (postagens) públicos. Buscaram, assim, monitorar os principais tópicos, palavras-chave e fontes de tendência do Twitter associados à COVID-19 e capturar conversas em relação ao surto da doença.

Para o rastreamento das conversas, os pesquisadores cadastraram um conjunto de palavras-chave (coronavirus; coronapocalypse; covidiot; Wuhan coronavirus; panic bying; chinese virus, stayhomechallenge; pandemic, entre outras) e contas relacionadas à COVID-19 na interface de programação de aplicativos aberta (API) do Twitter. Esta retorna quaisquer tweets que tenham alguma das palavras-chave no texto ou nos metadados (dados sobre dados), tornando possível compor um banco de dados permanentes com os conteúdos abordados, em língua inglesa. Como a coleta é contínua, o artigo traz link para acesso às postagens coletadas após 21 de março de 2020 e os autores informam que o banco de dados ficará permanentemente à disposição de outros pesquisadores.

Os procedimentos legais acordados com o Twitter não permitem divulgar publicamente o texto dos tweets coletados. Desse modo, estão registrados no artigo somente os identificadores (ID) vinculados aos tweets específicos. A consulta aos ID permite a outros pesquisadores ter acesso ao conteúdo da postagem e aos metadados dos autores. Tomando como referência a linha de tempo da pandemia, divulgada pelos veículos de comunicação Business Insider, NBC e CNN, os autores analisam relações entre os principais eventos desse período e o discurso veiculado no Twitter.

A subcadeia de hashtags “coronavirus” é recorrente permanentemente no conjunto de dados; seu aparecimento cresceu no dia em que a OMS declarou a COVID-19 uma emergência global de saúde pública e no dia em que os Estados Unidos anunciaram a primeira morte relacionada à doença. Não houve registro da hashtag “covid” antes de 11 de fevereiro de 2020, data em que “COVID-19” foi anunciado como o nome oficial da doença. O aparecimento da palavra-chave “wuhan” nas hashtags foi consistente nos primeiros meses desse ano, mas declinou a partir daí, refletindo a diminuição de casos na China. Na ocorrência dos grandes eventos envolvendo o desenvolvimento da pandemia (declarações oficiais da OMS, alta de casos, aparecimento da doença e registro de primeiras mortes nos países, etc.) as contas mais ativas são as que incluem usuários identificados pelo Twitter como contas de interesse público e verificados como autênticos.