27 Apr
27Apr

Por Daniel Christian Henrique, Gabriel Dudena de Faria (Bolsista de Extensão Probolsas) e João Carlos Prats Ramos (Bolsista de Extensão Probolsas)

O vírus da Covid-19 foi confirmada como pandemia mundial nos primeiros meses de 2020. Desde então, o mundo moderno passou por algo não visto ainda em sua história: o enclausuramento de todas as pessoas, em todos os países, dentro de suas casas, trabalhando remotamente (quando possível). Muitos segmentos não conseguiram suportar economicamente por muito tempo, seja pela falta de flexibilidade na adaptação ao mundo virtual ou mesmo em razão de sua total impossibilidade - como no caso de diversos tipos de comércios e serviços. 

Adicionalmente, elevou-se dramaticamente o número de demissões, fome ao redor do mundo e mortes (direta ou indiretamente ligadas a covid), em especial no primeiro ano quando ainda estava em desenvolvimento alguma potencial vacina. Em consequência, formava-se uma situação nebulosa diária, principalmente nos dois primeiros anos, com noticiários dia-a-dia divulgando a elevação do número de casos ativos e de mortes, assim como seus severos impactos nas economias regionais, nacionais e mundial. 

Alcançado o ano de 2022, com diversas vacinas desenvolvidas e em franca aplicação mundo afora, somada às flexibilizações sanitárias em parte significativa dos países, variantes de menor potencial agressivo (como a Ômicron) e divulgação massiva dos dados em todos continentes referentes a pandemia, tinha-se neste momento um cenário diferente: retomada gradual de atividades econômicas e com número de infecções e mortes reduzindo gradualmente, porém nunca eliminada. A covid passa a ser um obstáculo, mas não um impeditivo à retomada das atividades econômicas. Abordando este cenário, pôde-se realizar o seguinte estudo: 

Qual o melhor modelo preditivo de Inteligência Artificial para previsão do PIB mundial Per Capita considerando o número de casos ativos e de mortes por covid para este período de maior flexibilização sanitária iniciada em 2022?

A importância deste informativo recai, portanto, no surgimento de uma potencial nova variante (como a Arcturus já se disseminando) do vírus da covid no qual possa vir a elevar novamente o número de casos e de mortes, necessitando prever os novos percalços no PIB (Produto Interno Bruto) mundial, porém permanecendo ainda as flexibilizações sanitárias defronte à vacinação mais massiva da população mundial. As vacinações têm se mostrado essenciais para manutenção do retorno às atividades econômicas presenciais (ou mistas com as remotas) mesmo com novas variantes consideradas mais fracas permanecendo ainda em circulação. Ou mesmo o contrário, observar as previsões das perspectivas de evolução do PIB mundial via redução drástica das variantes atuais para os próximos anos, considerando até mesmo sua total eliminação.  

Para configuração desta análise, abordou-se os dados divulgados pelo Our World in Data (2023) - instituição que que tem por propósito disseminar dados gratuitamente para uso em pesquisas com o intuito de agilizar o entendimento dos grandes problemas da sociedade como pobreza, mudanças climáticas, desigualdades, etc. 

Metodologicamente optou-se por fazer um comparativo através de três análises de Inteligência Artificial com uso de machine learning em modelos de redes neurais, random forest e regressões múltiplas. Para todas configurações os dados passaram por procedimentos de normalização e foram divididos em 75% para treino e obtenção dos modelos, com posterior 25% dos dados para teste destes modelos. As variáveis aplicadas, portanto, às três métricas de machine learning foram: 

  • Casos Totais = número total de casos confirmados de Covid 19, incluindo casos prováveis quando relatados. Variável Independente (X). 
  • Mortes Totais = número total de mortes atribuídas a Covid 19, incluindo casos prováveis quando relatados. Variável Independente (X). 
  • Casos Totais por Milhão = número total de casos confirmados de Covid 19 por 1.000.000 de pessoas, incluindo casos prováveis quando relatados. Variável Independente (X). 
  • Mortes Totais por Milhão = número total de mortes atribuídas a Covid 19 por 1.000.000 de pessoas, incluindo casos prováveis quando relatados. Variável Independente (X). 
  • PIB per capita = Produto Interno Bruto em Paridade de Poder de Compra (dólares) para o ano mais recente. Variável Dependente (Y).

Em um primeiro momento, foram selecionados os dados destas variáveis para todos os países em todos os continentes ajustados somente para o ano de 2022 (focado na flexibilização sanitária). Seguiu-se a realização dos procedimentos organização e limpeza dos dados ausentes, restando para as análises os dados de 193 países. Variáveis existentes relacionadas à vacinação, testes e hospitalizações não foram possíveis de serem utilizadas neste estudo defronte ao grande número de dados ausentes em parte significativa dos países no banco de dados em uso.

Decision Tree e Random Forest

Após aplicação de modificações nas quantidades de nós da árvore e sistemas de poda, obteve-se a seguinte melhor configuração em suas ramificações para otimização de suas métricas de resíduos: 

RMSE: 0.748324
MAE: 1.252291

RMSE: Root Mean Squared Error; MAE: Mean Absolute Error 

Decorrido um alto valor de erro, abordou-se o uso do Randon Forest para sua redução e otimização. Após rodar-se diversas variações na quantidade de árvores e nós nas ramificações, chegando-se ao seguinte resultado com uso de 30 árvores e número máximo de 6 nós:

RMSE: 0.6672095
MAE: 1.149754

RMSE: Root Mean Squared Error; MAE: Mean Absolute Error 

Apesar da melhora, os erros do modelo foram ainda considerados altos e não passíveis de uso para predições do PIB per capita mundial.

Redes Neurais

Inúmeras configurações foram testadas com programações de deeplearning, alcançando-se o melhor resultado com 1000 epochs e três camadas ocultas contendo respectivamente 30, 40 e 25 neurônios, obtendo-se as seguintes métricas de erro: 

RMSE: 0.5829489
MAE: 0.3287849

RMSE: Root Mean Squared Error; MAE: Mean Absolute Error 

Tomando-se como comparativo apenas o RMSE e MAE, comum às métricas anteriores aplicadas no Random Forest, constata-se uma significativa melhoria na redução do erro, chegando-se a um padrão aceitável de uso deste modelo. Considerando-se as milhares de variáveis que podem impactar os PIBs dos países no mundo, um MAE de 0,329 pode ser tomado como de ótimo valor ao se considerar o uso apenas das variáveis relacionadas aos números de infecções e mortes advindas do covid-19 em 2022 para sua previsão.

Regressão Múltipla

O uso de todas variáveis independentes não foi possível nesta configuração de inteligência artificial, gerando problemas na obtenção da matriz resultados e requerendo aplicar uma etapa estatística prévia de stepwise para selecionar as variáveis mais significativas, restando apenas: casos totais e mortes totais para previsão do PIB per capita no mundo. Em sequência, aplicou-se o tratamento de machine learning para geração da equação preditiva e seguintes métricas de coeficientes, normalidade e R2:


p-valueSituação
Intercept<0.0001Aprovado
Casos totais<0.0001Aprovado
Mortes totais<0.0001Aprovado
F-statistic:< 2.2e-16Aprovado
Shapiro-Wilk normality test0.3002Aprovado
R20,3933Razoável

R2: qualidade de ajuste do modelo

Gerando-se, em seguida, as métricas de erro do modelo, alcançou-se os valores de:

RMSE: 0.9252366
MAE: 0.7310177

RMSE: Root Mean Squared Error; MAE: Mean Absolute Error 

Nota-se que apesar das variáveis obterem aprovações no teste t de seus coeficientes, assim como no teste F de sua equação preditiva e na normalidade de seus resíduos, o R2 pode ser considerado apenas como razoável (considerando-se, novamente, somente as variáveis em análise). Apesar do seu uso ser possível, suas métricas de erro RMSE e MAE são maiores no comparativo ao modelo de redes neurais. Portanto, modelo excluído por estar em desvantagem ao anterior. 

Conclusão

Abordando-se procedimentos de Inteligência Artificial em três modelos de predições: random forest, redes neurais e regressões múltiplas (considerando-se 75% dos dados para treino e 25% para teste), para prever-se possíveis variações do PIB per capita mundial em um momento de flexibilização das atividades econômicas (e vírus menos letais como a variante Ômicron) abordando-se exclusivamente as quatro principais variáveis relacionadas à pandemia da covid-19 (casos totais e por milhão + mortes totais e por milhão), conclui-se que o uso das redes neurais com três camadas ocultas de neurônios (30, 40 e 25) é a que melhor reduz os erros preditivos. Reforça-se que é necessário desnormalizar os resultados para seu entendimento adequado. 

Finalmente, de posse deste melhor modelo oriundo de Inteligência Artificial, possíveis previsões de aumento ou diminuição do vírus da covid no mundo advindo de uma possível nova variante que se expanda (como a atual variante Arcturus), ocasionando oscilações nos números de casos e mortes ou mesmo suas reduções drásticas podem ser abordados para observação de seus impactos no PIB per capita mundial – possibilitando em consequência a realização de estudos prévios por parte dos governos para possíveis estímulos governamentais às suas economias ou ações preventivas.

Em breve será ofertado continuidade a este estudo com variações por continentes, países desenvolvidos e subdesenvolvidos e simulações. Acompanhe!

Referência: Our World in Data. Pandemia do Coronavírus (Covid-19) (2023)

Como citar este informativo? (padrão ABNT)

HENRIQUE, Daniel Christian; FARIA, Gabriel Dudena de; RAMOS, João Carlos Prats. Inteligência artificial para prever o PIB per capita mundial abordando as variáveis da covid-19 em período de flexibilização sanitária. 2023. Desenvolvido por GPFA - Grupo de Pesquisa em Finanças Analíticas. Disponível em: https://www.gpfa.com.br/informes/previsao-pib-mundial-flexibilizacao-sanitaria-covid. Acesso em: (data de seu acesso ao site).

Comentários
* O e-mail não será publicado no site.