Data Race

Metodologia

Como processamos e visualizamos os dados

A transparência é fundamental para nossa missão. Esta página explica como coletamos, processamos e apresentamos estatísticas globais.

Coleta de Dados

Usamos pipelines ETL (Extração, Transformação, Carga) escritos em Python para coletar dados de APIs oficiais:

  1. Buscar dados brutos das APIs de origem (Banco Mundial, FAO, etc.)
  2. Validar a completude e formato dos dados
  3. Armazenar dados brutos em formato estruturado para processamento

Processamento de Dados

Os dados brutos passam por várias etapas de processamento:

  1. Padronização de códigos de países (ISO 3166-1 alfa-3)
  2. Exclusão de valores ausentes (linhas sem valores são removidas, sem interpolação)
  3. Normalização de unidades quando aplicável
  4. Atribuição de classificação regional
  5. Cálculo de rankings (global e regional)

Cálculo de Rankings

Os rankings são calculados para cada ano independentemente:

  • Ranking Global: Posição entre todos os países com dados para aquele ano
  • Ranking Regional: Posição dentro da região atribuída
  • Variação de Ranking: Diferença em relação ao ano anterior (positivo = melhoria)
  • Variação Ano a Ano: Variação percentual no valor em relação ao ano anterior

Visualização

Nossas visualizações são construídas com desempenho e acessibilidade em mente:

  • Corrida de Gráfico de Barras: Renderização baseada em Canvas para animação suave de 60fps
  • Gráfico de Linha: Baseado em SVG com dicas de ferramentas interativas
  • Design responsivo para todos os tamanhos de tela
  • Interpolação de dados para transições suaves entre anos

Qualidade dos Dados

Tomamos várias medidas para garantir a qualidade dos dados:

  • Usar apenas fontes de dados oficiais e reconhecidas
  • Preservar valores originais sem modificação
  • Dados ausentes são excluídos em vez de estimados — nenhuma interpolação ou imputação é aplicada
  • Variações ano a ano e variações de ranking são zeradas para o primeiro ano disponível de um país
  • Indicar claramente lacunas e limitações nos dados
  • Documentar todas as etapas de processamento

Limitações Conhecidas

Os usuários devem estar cientes destas limitações:

  • A disponibilidade de dados varia por país e ano
  • Alguns países podem ter dados históricos incompletos
  • Mudanças metodológicas pelas organizações de origem podem afetar a comparabilidade
  • Dados econômicos podem ser revisados pelas organizações de origem
  • Países ou territórios pequenos podem não ter dados disponíveis