Metodologia
Como processamos e visualizamos os dados
A transparência é fundamental para nossa missão. Esta página explica como coletamos, processamos e apresentamos estatísticas globais.
Coleta de Dados
Usamos pipelines ETL (Extração, Transformação, Carga) escritos em Python para coletar dados de APIs oficiais:
- Buscar dados brutos das APIs de origem (Banco Mundial, FAO, etc.)
- Validar a completude e formato dos dados
- Armazenar dados brutos em formato estruturado para processamento
Processamento de Dados
Os dados brutos passam por várias etapas de processamento:
- Padronização de códigos de países (ISO 3166-1 alfa-3)
- Exclusão de valores ausentes (linhas sem valores são removidas, sem interpolação)
- Normalização de unidades quando aplicável
- Atribuição de classificação regional
- Cálculo de rankings (global e regional)
Cálculo de Rankings
Os rankings são calculados para cada ano independentemente:
- Ranking Global: Posição entre todos os países com dados para aquele ano
- Ranking Regional: Posição dentro da região atribuída
- Variação de Ranking: Diferença em relação ao ano anterior (positivo = melhoria)
- Variação Ano a Ano: Variação percentual no valor em relação ao ano anterior
Visualização
Nossas visualizações são construídas com desempenho e acessibilidade em mente:
- Corrida de Gráfico de Barras: Renderização baseada em Canvas para animação suave de 60fps
- Gráfico de Linha: Baseado em SVG com dicas de ferramentas interativas
- Design responsivo para todos os tamanhos de tela
- Interpolação de dados para transições suaves entre anos
Qualidade dos Dados
Tomamos várias medidas para garantir a qualidade dos dados:
- Usar apenas fontes de dados oficiais e reconhecidas
- Preservar valores originais sem modificação
- Dados ausentes são excluídos em vez de estimados — nenhuma interpolação ou imputação é aplicada
- Variações ano a ano e variações de ranking são zeradas para o primeiro ano disponível de um país
- Indicar claramente lacunas e limitações nos dados
- Documentar todas as etapas de processamento
Limitações Conhecidas
Os usuários devem estar cientes destas limitações:
- A disponibilidade de dados varia por país e ano
- Alguns países podem ter dados históricos incompletos
- Mudanças metodológicas pelas organizações de origem podem afetar a comparabilidade
- Dados econômicos podem ser revisados pelas organizações de origem
- Países ou territórios pequenos podem não ter dados disponíveis