Data Race

Metodologia

Come elaboriamo e visualizziamo i dati

La trasparenza è al centro della nostra missione. Questa pagina spiega come raccogliamo, elaboriamo e presentiamo le statistiche globali.

Raccolta dei Dati

Utilizziamo pipeline ETL (Extract, Transform, Load) scritte in Python per raccogliere dati dalle API ufficiali:

  1. Recupero dei dati grezzi dalle API fonte (World Bank, FAO, ecc.)
  2. Validazione della completezza e del formato dei dati
  3. Archiviazione dei dati grezzi in formato strutturato per l'elaborazione

Elaborazione dei Dati

I dati grezzi subiscono diverse fasi di elaborazione:

  1. Standardizzazione dei codici paese (ISO 3166-1 alpha-3)
  2. Esclusione dei valori mancanti (le righe senza valori vengono rimosse, nessuna interpolazione)
  3. Normalizzazione delle unità dove applicabile
  4. Assegnazione della classificazione regionale
  5. Calcolo della classifica (globale e regionale)

Calcolo della Classifica

Le classifiche vengono calcolate indipendentemente per ogni anno:

  • Classifica Globale: Posizione tra tutti i paesi con dati per quell'anno
  • Classifica Regionale: Posizione all'interno della regione assegnata
  • Variazione di Classifica: Differenza rispetto all'anno precedente (positivo = miglioramento)
  • Variazione Anno su Anno: Variazione percentuale del valore rispetto all'anno precedente

Visualizzazione

Le nostre visualizzazioni sono costruite con prestazioni e accessibilità in mente:

  • Gara di Grafici a Barre: Rendering basato su Canvas per animazioni fluide a 60fps
  • Grafico a Linee: Basato su SVG con tooltip interattivi
  • Design responsive per tutte le dimensioni dello schermo
  • Interpolazione dei dati per transizioni fluide tra gli anni

Qualità dei Dati

Adottiamo diverse misure per garantire la qualità dei dati:

  • Utilizzo solo di fonti di dati ufficiali e autorevoli
  • Preservazione dei valori originali senza modifiche
  • I dati mancanti vengono esclusi anziché stimati — nessuna interpolazione o imputazione viene applicata
  • Le variazioni anno su anno e le variazioni di classifica sono impostate a zero per il primo anno disponibile di un paese
  • Indicazione chiara delle lacune nei dati e delle limitazioni
  • Documentazione di tutte le fasi di elaborazione

Limitazioni Note

Gli utenti devono essere consapevoli di queste limitazioni:

  • La disponibilità dei dati varia per paese e anno
  • Alcuni paesi potrebbero avere dati storici incompleti
  • I cambiamenti metodologici da parte delle organizzazioni fonte possono influire sulla comparabilità
  • I dati economici possono essere rivisti dalle organizzazioni fonte
  • I piccoli paesi o territori potrebbero non avere dati disponibili