Data power: um exemplo simples para testar informações do governo


"A vida é a arte de tirar conclusões suficientes
a partir de informações insuficientes."
(Samuel Butler)


A participação política qualificada só existe com acesso à informação. Para qualquer fenômeno político sobre o qual se queira intervir, essa é a condição. Então, numa ação política, o que seria mais importante do que preservar a vida dos cidadãos? No limite, essa constatação exige honestidade e altíssima qualidade das informações acerca da segurança pública. Se os gestores públicos atendem essa exigência ou não é a dúvida que vamos procurar dirimir neste texto, com a ajuda de algumas ferramentas estatísticas simples.

Todos os dias tomamos conhecimento de sequências de homicídios que ocorrem das mais diversas formas e são difundidas pelo noticiário policial. Mas o trabalho jornalístico não substitui a publicidade que deve ser dada aos processos e resultados governamentais. E por um motivo muito simples. O jornalismo não difunde informações de forma organizada e sistemática. O princípio da publicidade na administração pública, por outro lado, deve(ria) atender a esses critérios e outros ligados à qualidade da transparência (o MPF estabeleceu 16 critérios aqui).

Muito da sensação de impotência do cidadão comum está ligada à falta de informação de qualidade. Essa incapacidade para o exercício do controle social eficaz, esse mal-estar de não vislumbrar qualquer forma de influenciar os rumos das instituições, é posto a termo a partir do momento que temos alguns insumos que nos permitem lançar mão da análise de dados.

Aqui vamos fazer interpretações dos dados disponíveis sobre homicídios. Ou, no jargão: Crimes Violentos Letais Intencionais (CVLI). As secretarias estaduais responsáveis pela segurança pública têm o dever de publicizar regularmente seus registros com o máximo possível de detalhes descritores. Mas isso não quer dizer que os gestores públicos cumprem essa determinação. Foi o que lemos, por exemplo, na Folha de São Paulo, em 17/2/16, quando o jornal anunciou que buscaria a Justiça para forçar o governador a voltar atrás e liberar dados detalhados sobre os homicídios na cidade de São Paulo. Os dados haviam sido solicitados pela Folha desde novembro 2015.

Além dessa má vontade política, temos que atentar para o fato de até quando cumprem com o princípio da publicidade, não podemos ter certeza que os dados estão a contento. Então, “o que fazer?”, pergunta o leitor. Nesse caso, existem técnicas que permitem apreciar a veracidade e qualidade do que está sendo divulgado. Peguemos, então, as informações de Pernambuco, estado em que os autores deste texto residem.

Vamos analisar os dados divulgados (em formato pdf, que sabidamente já dificulta a análise...) pela Secretaria de Defesa Social entre 2007 e 2015. No banco de dados constam o número de CVLI por média anual e mensal. Abaixo montamos gráficos com a variação da média dos CVLI:



Nesse primeiro, a linha tracejada representa a média geral dos períodos. Em 2007, em média, 383 homicídios ocorreram por mês. A tendência de queda se estabiliza entre 2010 e 2011 e volta a cair até 2013. A partir daí, tem-se um crescimento consecutivo durante dois anos, atingindo o patamar de 304 mortes mês em 2015, o que representa uma média de mais de 30 mortes por dia.



Agora, três pontos chamam rapidamente a atenção. O primeiro deles é que, em média, março é o mês mais violento do período (2007-2015). O segundo nos mostra que o primeiro semestre (324,31) tende a ser mais violento do que o segundo (298,91), pois a diferença média de 25,407 mortes é estatisticamente significativa para um nível de significância menor que 5%. Por fim, vemos que dezembro é um mês atípico em relação ao restante da série, o que sugere a existência de algum fator interveniente.

Essa análise básica já nos fornece indicações importantes sobre possíveis padrões temporais dos homicídios. Contudo, ainda podemos ir além. Por que não examinarmos a variação da série em termos de tendência, e testarmos se os dados da Secretaria são confiáveis? O gráfico abaixo nos ajuda nessa iniciativa de controle social:



O que vemos aqui? A linha azul representa o melhor modelo que explicaria a variação dos CVLI ao longo do tempo se essa variação for, na verdade, linear. O R2 de 0,387 significa, contudo, que essa linha nos diz que menos de 40% da variação do CVLI muda de acordo com o tempo. Por outro lado, a curva vermelha ilustra uma função quadrática e apresenta um melhor ajuste (0,577), ou seja, quase 60% da mudança dos CVLI é compartilhada com a mudança de meses e anos. Em termos não técnicos, isso quer dizer que: os CVLI pararam de cair, e agora crescem em Pernambuco. Mas ainda há um ponto fora da curva… Para 2015, o círculo verde ilustra um caso muito destoante dos demais. A média dos CVLI em outubro durante o período foi de 289, muito diferente do valor observado em 2015, de 137. Outra informação que levanta suspeita sobre essa observação é a comparação de médias em novembro. A média geral do período foi de 300 enquanto que em 2015 esse valor foi de 357. Para garantir resultados mais claros, é possível analisar ainda a correlação dos CVLI com o seu valor defasado. Com isso fica graficamente evidente que os meses de outubro e novembro de 2015 não condizem com o padrão observado nos demais dados da série:



Bem, nosso objetivo aqui foi mostrar, da forma mais didática possível, uma maneira como os cidadãos, de posse dos dados, podem testar com objetividade os indicadores governamentais. Como dito, o acesso e capacidade de interpretar as informações é a condição sobre a qual pode brotar o empoderamento. A conclusão é que, em que pese possíveis falhas nos dados, deve-se concentrar esforços durante o primeiro semestre, em particular, entre fevereiro e abril. Além disso, o aumento do efetivo durante o mês de dezembro teria um forte efeito sobre a redução do número total de CVLI em PE.

Mas pensando num cenário de quebra do princípio da publicidade como ocorreu em São Paulo, como pressionar ou mesmo contribuir com conclusões como essas se as ciências humanas não dispõem dos insumos essenciais para seu ofício? Um governo que não facilita o acesso a indicadores, não leva a sério seus eleitores. E isso só nos permite uma conclusão: não é possível confiar sem testar.


ps1. esse texto é mais um fruto de uma longa e bastante empolgante parceria nossa com o grande amigo Dalson Figueiredo, prof. da UFPE. Há uma versão resumida deste artigo em seu blog DataFobia.  
ps2. Os dados foram analisados conforme estavam disponíveis no site da SDS/PE, em pdf, no final de janeiro deste ano.
ps3. para receber as atualizações do Despertador no Facebook: www.facebook.com/ODespertador

Comentários