English French German Spain Italian Dutch
Russian Portuguese Japanese Korean Arabic Chinese Simplified

Papel das técnicas da mineração de dados biológicos e da aprendizagem de máquina para detectar e diagnosticar o novo Coronavírus: uma revisão sistemática

BARBOSA, Carlos Roberto Hall

Albahri, A. S.; et al. Role of biological data mining and machine learning techniques in detecting and diagnosing the novel Coronavirus (COVID-19): a systematic review. Journal of Medical Systems, v. 44, n. 7, p. 122-135, May, 2020. DOI: 10.1007/s10916-020-01582-x Disponível em: https://link.springer.com/article/10.1007/s10916-020-01582-x

Este artigo apresenta uma revisão sistemática de Inteligência Artificial (IA) aplicada à detecção e diagnóstico da COVID-19, com base em algoritmos de Mineração de Dados (MD) e Aprendizado de Máquina (AM). A motivação é o crescente interesse no desenvolvimento de aplicações de IA para a área da Saúde e o potencial de tais técnicas na prevenção a pandemias.

A revisão sistemática foi baseada no modelo PRISMA, utilizando cinco bases de dados digitais que cobrem todos os aspectos acadêmicos relacionados à COVID-19: ScienceDirect, IEEE Xplore, Web of Science, PubMed e Scopus. Buscaram-se artigos em inglês, em periódicos ou congressos, de 2010 a 2020, utilizando diversas combinações de palavras-chave relacionadas a qualquer tipo de coronavírus e à detecção, diagnóstico e classificação de CoV por IA e AM. Inicialmente, identificaram-se 1239 artigos que atendiam aos critérios de inclusão, mas a revisão de títulos e resumos reduziu este número para 249 artigos, que foram lidos em sua totalidade. Após a aplicação dos critérios de exclusão (não descritos neste artigo de revisão), somente 8 artigos foram mantidos na análise.

Considerando os 8 artigos analisados na íntegra, identificaram-se 12 métodos de IA aplicados ao processamento de dados de CoV, sendo a árvore de decisão o mais frequente (5 vezes), seguido dos algoritmos Naive Bayes e SVM (4 vezes cada) e KNN (2 vezes). Todos os artigos foram publicados no período de 2016 a 2019 e dedicaram-se à pandemia MERS-CoV (tendo um artigo também considerado a SARS-CoV). Apresentam-se tabelas com os principais resultados dos artigos, principalmente em termos de exatidão de classificação, e com as bases de dados médicos usadas por cada artigo, incluindo os links de acesso quando disponíveis.

Em seguida, o artigo descreve brevemente cada um dos 8 artigos incluídos na revisão, indicando as principais conclusões e resultados. Independentemente da técnica de IA empregada, há uma clara prevalência da idade como fator de risco nas pandemias estudadas. O pequeno número de artigos identificados (todos dedicados à MERS-CoV) e a ausência de estudos e bases de dados relacionados à atual pandemia da COVID-19 indicam a necessidade e a oportunidade de aplicar IA à previsão de tais eventos. Outros métodos conhecidos de classificação, como Redes Neurais Artificiais, Aprendizado por Reforço e Clustering, bem como técnicas integradas de otimização, como Algoritmos Genéticos e Enxame de Partículas, ainda não foram aplicados à detecção e diagnóstico de CoV.

Analisando as características dos artigos revisados, a motivação principal reside no fato de que MD para diagnóstico médico é eficiente e pode ser utilizada para controlar a disseminação de pandemias, além de estimar e prever as taxas de infecção e recuperação, identificando os fatores dominantes. Alguns desafios já identificados são: complexidade dos mecanismos das pandemias; ausência de bases de dados médicos sobre as pandemias; necessidade de novos métodos de monitoramento, devido às diferentes reações de governos e populações; e grande variabilidade dos sintomas. Recomenda-se especificamente um método de pré-processamento para preenchimento de valores faltantes, o uso da linguagem R e o desenvolvimento de sistemas baseados em IoT.

O artigo conclui com a preocupação com a carência de estudos científicos de IA aplicada à COVID-19, que traz sérias implicações à detecção e minimização da disseminação de tais pandemias. O objetivo deve ser realizar novos estudos que possam guiar os governos e populações no controle precoce de tais eventos pandêmicos. Indica também a necessidade do desenvolvimento de tecnologias integradas de sensores para emprego em espaços abertos.