Metodologia
La trasparenza è fondamentale per Data Race. Questa pagina spiega come le statistiche globali vengono raccolte, elaborate e presentate. I dati non vengono modificati, stimati o commentati: l'obiettivo è presentare le cifre ufficiali nel modo più fedele possibile.
Raccolta Dati
Tutti i dati vengono raccolti a livello di programmazione da API pubbliche ufficiali e provider di dati. Ogni set di dati viene recuperato utilizzando script Python che si connettono direttamente agli endpoint del provider, garantendo riproducibilità e tracciabilità. Non è coinvolto alcun inserimento manuale dei dati.
- Recupero dei dati grezzi dalle API ufficiali e provider di dati (World Bank Open Data, FAOSTAT, Yahoo Finance, ecc.)
- Convalida dell'integrità della risposta: controllo dei campi previsti, dei tipi di dati e della completezza
- Archiviazione dei dati convalidati in formato tabulare strutturato per la pipeline di elaborazione
- Registrazione dell'URL di origine, del timestamp di recupero e del conteggio dei record per ogni set di dati
Elaborazione Dati
I dati grezzi sono sottoposti a una pipeline di elaborazione deterministica. Ogni passaggio è automatizzato e produce lo stesso output a parità di input. L'interpolazione e la stima vengono intenzionalmente evitate: se un punto dati manca dall'origine, rimane mancante nel set di dati.
- Identificazione delle entità — codici ISO 3166-1 alpha-3 per i paesi (es. USA, JPN, DEU), simboli ticker per le aziende (es. AAPL, MSFT)
- Esclusione dei valori mancanti: gli spazi vuoti vengono preservati, mai riempiti con stime
- Classificazione regionale utilizzando una mappatura fissa dei paesi in 13 regioni geografiche
- Calcolo della classifica per ogni periodo di tempo: classifiche globali e all'interno della regione
- Output nel formato Apache Parquet per interrogazioni efficienti basate su browser
Calcolo delle Classifiche
Le classifiche vengono ricalcolate in modo indipendente per ogni periodo di tempo. Solo i paesi con dati riportati per quello specifico periodo sono inclusi nella classifica. Ciò significa che la posizione di un paese può cambiare non solo perché il suo valore è cambiato, ma anche perché altri paesi hanno iniziato o smesso di fornire dati.
- Classifica Globale: Posizione tra tutti i paesi con dati per quello specifico periodo
- Classifica Regionale: Posizione all'interno della regione geografica assegnata al paese
- Variazione di Classifica: Differenza rispetto alla posizione in classifica del periodo precedente (positivo = salito)
- Variazione Anno su Anno: Variazione percentuale del valore sottostante rispetto al periodo precedente
- Tipo di Classifica: Ogni set di dati è classificato come 'best' (più alto è meglio, es. PIL), 'worst' (più alto è peggio, es. emissioni di CO2) o 'neutral' (nessuna direzione intrinseca, es. popolazione)
Visualizzazione
Le visualizzazioni vengono eseguite interamente nel browser utilizzando DuckDB-Wasm per le query SQL sui file Parquet. Nessun dato viene inviato a un server. Questa architettura garantisce tempi di caricamento rapidi, funzionalità offline e totale privacy dei dati.
- Corsa dei Grafici a Barre: Classifiche animate dei paesi che mostrano come cambiano le posizioni nel tempo
- Grafico a Linee: Serie temporali storiche con descrizioni comandi interattive al passaggio del mouse per valori dettagliati
- Grafico a Torta: Analisi delle quote proporzionali che mostra come è distribuito il totale globale
- Mappa del Mondo: Mappa termica geografica con scale codificate a colori per i modelli spaziali
- Tabella Dati: Classifiche ordinabili con valori, variazioni di classifica e confronti anno su anno
- Tutti i grafici supportano il filtraggio regionale, il blocco dei paesi e la selezione dell'intervallo di periodo
Qualità dei Dati
Diamo priorità all'accuratezza e alla trasparenza rispetto alla completezza. Invece di colmare le lacune con stime, mostriamo solo ciò che riportano le fonti ufficiali. Ogni visualizzazione si ricollega alla sua origine dati originale in modo che gli utenti possano verificare i numeri sottostanti.
- Utilizzo esclusivo di dati provenienti da organizzazioni e provider di dati consolidati con metodologie documentate
- Conservazione dei valori originali esattamente come riportati: nessun arrotondamento, aggiustamento o normalizzazione
- I dati mancanti vengono esclusi anziché stimati o interpolati
- Ogni pagina del set di dati mostra l'organizzazione di origine e un collegamento diretto ai dati originali
- La copertura dei dati (numero di paesi e intervallo di tempo) è mostrata su ogni visualizzazione
Limitazioni Note
Nessun set di dati è perfetto. Gli utenti dovrebbero considerare queste limitazioni nell'interpretazione delle visualizzazioni:
- La disponibilità dei dati varia notevolmente in base al paese e al periodo di tempo: alcune nazioni hanno dati dal 1960, mentre altre solo dagli anni 2000
- Le organizzazioni di origine possono rivedere i dati storici retroattivamente, il che significa che i valori passati possono cambiare tra un aggiornamento e l'altro
- I cambiamenti metodologici da parte delle organizzazioni di origine (es. modifiche al metodo di calcolo del PIL) possono influire sulla comparabilità anno su anno
- Piccoli paesi, territori e nazioni da poco indipendenti hanno spesso dati incompleti o mancanti
- Le classifiche riflettono solo i paesi che hanno riportato dati per un determinato periodo: l'assenza da una classifica non significa valore zero