Estatística – Ciência inexata?
Business and finance concept, young female hand pointing and touching graph chart on digital screen.

Estatística – Ciência inexata?

Quando estava na universidade, e acreditem que faz muito tempo, eu já afirmava repetidamente nos meus discursos como presidente associação atlética, que “não acredito no homem que critica e não apresenta uma solução como resposta”.

Seguindo esta imutável linha de pensamento, irei criticar tecnicamente a forma como a Rede Globo de Televisão, apresenta, diariamente, nos seus jornais televisivos, os dados referentes à evolução da Covid-19 no Brasil, tanto na utilização de médias móveis, como na pintura do mapa do país com uma aquarela limitada com saltos impunes entre as cores extremas, vermelha e azul, sem transitar, nos casos cabíveis, pelo “amarelo estabilidade”.

Tenho pleno respeito pelo grupo de profissionais contratados para manusear a base de dados pertinente, e pelo seu conhecimento estatístico capaz de produzir para a emissora informação detalhada, em formato didático para facilitar a compreensão da grande massa de telespectadores, que não tem a obrigação de conhecer os métodos e os mecanismos utilizados. Este público diverso deveria, simplesmente, receber uma mensagem clara para serenar ou não suas expectativas quanto à evolução desta doença severa, que acabou se alastrando pelo mundo inteiro.

Se formos objetivos e rápidos na busca da definição de Estatística na “Wikipédia – A enciclopédia livre”, encontraremos: “Estatística é a ciência que se utiliza das teorias probabilísticas para explicar a frequência da ocorrência de eventos, tanto em estudos observacionais quanto em experimentos, para modelar a aleatoriedade e a incerteza, de forma a estimar ou possibilitar a previsão de fenômenos futuros, conforme o caso.” Esta elucidação pode ser considerada correta e completa, mas de difícil compreensão a princípio.

Procurando-se uma acepção mais robusta junto à Barsa, obtém-se: “Estatística é a técnica auxiliar do estudo dos fenômenos coletivos, econômicos, sociais ou científicos. O termo estatística foi primeiramente empregado para designar o conjunto de dados referentes a assuntos de interesse do Estado, geralmente com a finalidade de controle fiscal ou de segurança nacional.” O interessante nessa fonte foi que a Estatística é considerada uma técnica e não uma ciência.

A citada enciclopédia, tradicional e muito reconhecida, escolheu uma definição mais clássica e aparentemente antiquada, fato que me obrigou a angariar outros enfoques na Delta Larousse, que optou, também, por tratar o termo pelo lado histórico, e que complementou sua exposição através de uma sequência de curtas definições mais de vanguarda, como: “é o estudo de conjuntos numéricos e de suas relações”, “é o meio de obter indicações prováveis sobre conjuntos imperfeitamente conhecidos”, e “é o atributo que se liga à ideia da produção, mais ou menos frequente, de uma dada circunstância, por ocasião de uma série de experiências”. Fora a contribuição histórica dessas referências quase obrigatórias, vimos que pouco evoluímos no que realmente é entendido hoje por Estatística.

Pelo dicionário Caldas Aulete, Estatística é a “ciência dos fatos sociais expressos em termos numéricos, a qual ensina a conhecer uma nação debaixo do ponto de vista da sua extensão, população, indústria, agricultura, administração, instrução, força militar, marinha, comércio etc., em um dado momento”. Com mais este passo cambaleante e inseguro, nossa evolução no assunto parece caminhar como uma tartaruga cansada.

Ao provocar ventos de vanguarda, pode-se estabelecer com mais segurança que Estatística é uma ciência dedicada a definir os melhores métodos para a coleta, organização, análise, e interpretação sobre um agrupamento de dados (amostra ou população) de mesma natureza e suas possíveis relações. Logo, explicações e conclusões com excelência são esperadas desse trabalho árduo e meticuloso que requer observação atenta.

Tentando retornar ao campo da objetividade, e seguindo a interpretação de alguns autores contemporâneos, procura-se, através da Estatística, a produção de informação qualificada, a partir dos dados disponíveis, para se tomar uma decisão, e dela, provocar uma ação.

Possivelmente, aqui começou a fazer água a saga da Globo, que tem como compromisso maior comunicar cristalinamente o que está acontecendo, sem vieses suspeitos. Preferiu criar virtualmente um globo giratório e espelhado das pistas de dança das discotecas, com seus incríveis efeitos visuais, deixando de informar, para fascinar e alucinar um público já apreensivo e assustado.

Começando a diversão no Mundo Gloob, não há sentido algum comparar médias móveis de dados cuja quantificação foi alterada no tempo, por uma ação externa. Trata-se de se produzir Estatística a partir de uma base conhecidamente em alteração. Refiro-me ao número de casos confirmados de contato com o vírus da Covid-19, onde a testagem segue crescente. Logo, até para os leigos, não se pode tratar as medições diárias como se não apresentassem “vício”, o que descaracteriza e contamina a probabilidade dos eventos que estão sendo analisados.

Não desaprovo comparar duas médias móveis de 14 dias, uma em seguida da outra, e arbitrar que, caso a variação fosse superior a 15%, para mais ou para menos, estigmatizaria uma mudança de tendência. Por que não foram consideradas médias móveis com número de elementos diferentes, tipo média móvel de 14 dias versus a média móvel de 56 dias, por exemplo (conhecida como 1 para 4)? Esta comparação é muito mais rica e potente para identificação das alterações de tendência, e ficaria mais simples a transição por uma “zona pintada de amarelo”, que antes do cruzamento das curvas já suportaria a sinalização de uma possível inversão de tendência. Poder-se-ia seguir com os mesmos 15% da equipe de especialistas da empresa de comunicação, ou com 10%, caso quisermos prenunciar este evento com maior frequência.

Assim, depois do efetivo cruzamento, teríamos que esperar que o distanciamento das sinuosidades superasse os mesmos 15% de diferença, para, finalmente, trocar a cor do amarelo, para o vermelho ou para o azul, dependendo da situação apresentada pelas curvas.

Inúmeras perguntas podem surgir, tipo: “poder-se-ia voltar para o vermelho caso estivermos em uma indicação amarela que sucedeu uma vermelha?” Resposta: sim. O retorno ao estado anterior, não importando se era de cor vermelha ou azul, foi determinado pelas observações futuras que mostrariam uma retomada de tendência, utilizando-se o mesmo percentual arbitrado (15%).

Outra pergunta muito interessante seria sobre o tão comentado e, aparentemente, tão perigoso e longo patamar estabelecido em torno de mil mortes diárias. Assim, “como seria o bailar das cores durante a vida do patamar?”. Cabe aqui, antes de responder à pergunta, analisar o tamanho do patamar. Não tem nada a haver com a Estatística, e sim com as dimensões continentais do Brasil e de sua relevante população. Tivemos um movimento de caminhada do vírus a partir dos grandes centros, trafegando pelas principais rodovias, depois pelas secundárias e, finalmente, pelas estradas vicinais, transportando silenciosamente o vírus, cuja velocidade é de impossível mensuração. Outros meios de transporte, principalmente o aéreo, carregaram esta cruel virose muito mais rápido, através de passageiros infectados, visto que as primeiras medidas de contenção foram brandas e com baixa fiscalização.

Outros países apresentaram um crescimento assustador no número de mortes com patamares de transição de tendência curtos ou quase inexistentes, mostrando um up and down de fácil reconhecimento e constatação. Respondendo à pergunta academicamente, teremos duas curvas se cruzando com muita intensidade como se fossem dois fios torcidos de arame liso. A mudança de cor no patamar só ocorreria se o distanciamento entre os fios superasse a famosa amplitude de 15%, para cima ou para baixo. Caso não ocorressem grandes oscilações, seria uma “patamar amarelo” o tempo todo, até o surgimento de uma reversão real de tendência, que, possivelmente, apontaria o final desse patamar.

Assim, aquela mutante pintura do mapa do Brasil por estado federativo, que dá inveja a qualquer um dos autores dos logos das olimpíadas de Seul, Barcelona e Sidney, seria muito mais monótona e repetitiva, e acabaria não sendo apresentada em todos os telejornais, durante todos os dias nos últimos meses.

Esta explosão exagerada da informação em frações territoriais, sabidamente dispares em muito aspectos, principalmente, no populacional, ditaria a Newton que passasse a decompor a luz através de um prisma com espectro arbitrado e diminuto de cores, arrastando consigo alguns distúrbios no tratamento dos dados por estado da Federação, e que têm correção técnica conhecida, aparentemente não executada.

Dentro do estudo mais acurado e detalhado da Estatística, há um capítulo fundamental e denso que se debruça sobre o “tamanho da amostra”. Não irei me alongar neste assunto para não perder leitores, mas todos hão de concordar que uma morte a mais, em média móvel diária, sobre uma base 2, em Roraima (RR), por exemplo, parece ser mais crível e materializável do que 100 mortes a mais em São Paulo (SP), no mesmo período, com a correspondente base 200. Parece culinária algébrica, mas como a probabilidade sobre números deve ser a mesma, a proporcionalidade é uma “verdade incontestável”. Entretanto, é questionável!

Quando manipulamos números menores, as casas decimais, geradas nos cálculos das médias, passam a ter maior relevância, mesmo sendo irreal a morte de 2,4 indivíduos. Assim, corremos rapidamente para truncar ou arredondar ou até incluir 0,6 indivíduo, e chegar, sem questionar, a 3 indivíduos “inteiros”. Ufa! Acabou o problema! Ledo engano, atento leitor! Dentro desta mesma linha lógica, que tratamento se deveria utilizar em face a um crescimento para 2,6 mortes em média móvel de 14 dias? Obviamente, o simples e rápido arredondamento para 3 óbitos, produzindo, também, uma axiomática variação nula.

Esperando que todos estejam na minha “wibe”, uma variação percentual real de 8,3% a mais no número de mortes, poderia saltar para 50% (de 2 para 3), parecendo a prática da alquimia pelos sábios, donos do conhecimento na Idade Média, que indicaria a “pintura global” em “vermelho sangue” e fim de papo. O movimento inverso de 7,7% apareceria como 33,3% (de 3 para 2), e o autorizado “azul céu de brigadeiro” traria um aparente alívio para os vassalos. Para onde expulsaram a cor (amarela) que acusa a transição entre as tendências? Ninguém sabe, ninguém viu. Sumiu!

Se os comunicadores acreditam que o estímulo visual é o mais eficiente, será que a sugestão de se trabalhar com a soma móvel dos últimos 14 dias e comparar com a soma móvel dos 14 dias precedentes, sem passar pela informação do número de mortes médias diárias, bastante polêmica, não apresentaria um percentual mais preciso para conduzir o pincel à cor apropriada?

Não há qualquer soberba da minha parte e nunca pretendi ofender profissionais da área, nem trazer qualquer desprestígio a quem quer que seja. Longe disso, apenas estou fazendo sugestões plausíveis!

Minha contribuição indagativa serve para provocar as mentes para perseguirem o melhor tratamento da base de dados, e que a informação final traga a honesta comunicação para  uma tomada de decisão balizada, na escolha da ação a ser escolhida no ataque a esta indesejada e perigosa pandemia, com maior assertividade e eficácia.

Caso contrário, a Estatística pode ser erroneamente interpretada como um instrumento tendencioso, que comunica o que os bastidores mandam, através de percentuais e cores “fabricados”,  trazendo o temerário risco de ser confundida com uma “ciência inexata”.

Deixe um comentário