Methodologie
Transparenz hat bei Data Race höchste Priorität. Diese Seite erklärt, wie globale Statistiken gesammelt, verarbeitet und präsentiert werden. Die Daten werden weder verändert noch geschätzt noch kommentiert – das Ziel ist es, offizielle Zahlen so originalgetreu wie möglich darzustellen.
Datenerfassung
Alle Daten werden programmatisch über offizielle öffentliche APIs und Datenanbieter gesammelt. Jeder Datensatz wird mit Python-Skripten abgerufen, die sich direkt mit den Endpunkten der Anbieter verbinden, was Reproduzierbarkeit und Rückverfolgbarkeit gewährleistet. Es erfolgt keine manuelle Dateneingabe.
- Abrufen von Rohdaten über offizielle APIs und Datenanbieter (World Bank Open Data, FAOSTAT, Yahoo Finance usw.)
- Überprüfung der Antwortintegrität – Kontrolle auf erwartete Felder, Datentypen und Vollständigkeit
- Speichern validierter Daten im strukturierten Tabellenformat für die Verarbeitungspipeline
- Protokollierung der Quell-URL, des Abruf-Zeitstempels und der Datensatzanzahl für jeden Datensatz
Datenverarbeitung
Rohdaten durchlaufen eine deterministische Verarbeitungspipeline. Jeder Schritt ist automatisiert und erzeugt bei gleichen Eingaben die gleichen Ausgaben. Interpolation oder Schätzungen werden bewusst vermieden – fehlt ein Datenpunkt in der Quelle, bleibt er auch im Datensatz fehlend.
- Entitätsidentifikation — Länder nach ISO 3166-1 alpha-3 (z. B. USA, JPN, DEU), Unternehmen nach Tickersymbolen (z. B. AAPL, MSFT)
- Ausschluss fehlender Werte – Lücken bleiben erhalten und werden nie mit Schätzungen gefüllt
- Regionale Klassifizierung mittels einer festen Zuordnung von Ländern zu 13 geografischen Regionen
- Berechnung der Platzierung für jeden Zeitraum – sowohl globale als auch regioneninterne Ranglisten
- Ausgabe im Apache Parquet-Format für effiziente browserbasierte Abfragen
Ranglistenberechnung
Die Ranglisten werden für jeden Zeitraum unabhängig neu berechnet. Nur Länder mit gemeldeten Daten für den spezifischen Zeitraum werden in das Ranking aufgenommen. Das bedeutet, dass sich der Rang eines Landes nicht nur ändern kann, weil sich sein Wert geändert hat, sondern auch, weil andere Länder begonnen oder aufgehört haben zu berichten.
- Globaler Rang: Position unter allen Ländern mit Daten für diesen spezifischen Zeitraum
- Regionaler Rang: Position innerhalb der zugeordneten geografischen Region des Landes
- Rangänderung: Differenz zur Rangposition des Vorzeitraums (positiv = aufgestiegen)
- Veränderung zum Vorjahr: Prozentuale Änderung des zugrunde liegenden Wertes gegenüber dem Vorzeitraum
- Ranglistentyp: Jeder Datensatz wird klassifiziert als 'best' (höher ist besser, z.B. BIP), 'worst' (höher ist schlechter, z.B. CO2-Emissionen) oder 'neutral' (keine inhärente Richtung, z.B. Bevölkerung)
Visualisierung
Visualisierungen laufen vollständig im Browser mit DuckDB-Wasm für SQL-Abfragen auf Parquet-Dateien. Es werden keine Daten an einen Server gesendet. Diese Architektur sorgt für schnelle Ladezeiten, Offline-Fähigkeit und vollständigen Datenschutz.
- Balkendiagramm-Rennen: Animierte Länderrankings, die zeigen, wie sich Positionen im Laufe der Zeit ändern
- Liniendiagramm: Historische Zeitreihen mit interaktiven Hover-Tooltips für detaillierte Werte
- Kreisdiagramm: Analyse des proportionalen Anteils, die zeigt, wie sich die globale Gesamtsumme verteilt
- Weltkarte: Geografische Heatmap mit farbcodierten Skalen für räumliche Muster
- Datentabelle: Sortierbare Rankings mit Werten, Rangänderungen und Jahresvergleichen
- Alle Diagramme unterstützen regionale Filterung, das Anheften von Ländern und die Auswahl von Zeiträumen
Datenqualität
Wir priorisieren Genauigkeit und Transparenz vor Vollständigkeit. Anstatt Lücken mit Schätzungen zu füllen, zeigen wir nur das, was offizielle Quellen berichten. Jede Visualisierung ist mit der ursprünglichen Datenquelle verlinkt, damit Benutzer die zugrunde liegenden Zahlen überprüfen können.
- Ausschließliche Verwendung von Daten etablierter Organisationen und Datenanbieter mit dokumentierten Methoden
- Exakte Beibehaltung der Originalwerte wie gemeldet – keine Rundungen, Anpassungen oder Normalisierungen
- Fehlende Daten werden ausgeschlossen statt geschätzt oder interpoliert
- Jede Datensatzseite zeigt die Quellorganisation und einen direkten Link zu den Originaldaten
- Die Datenabdeckung (Anzahl der Länder und Zeitraum) wird auf jeder Visualisierung angezeigt
Bekannte Einschränkungen
Kein Datensatz ist perfekt. Benutzer sollten diese Einschränkungen bei der Interpretation der Visualisierungen berücksichtigen:
- Die Datenverfügbarkeit variiert stark nach Land und Zeitraum – einige Nationen haben Daten ab 1960, andere erst ab den 2000er Jahren
- Quellorganisationen können historische Daten rückwirkend überarbeiten, was bedeutet, dass sich vergangene Werte zwischen Aktualisierungen ändern können
- Methodische Änderungen durch Quellorganisationen (z. B. Änderungen der BIP-Berechnungsmethode) können die Vergleichbarkeit im Jahresvergleich beeinträchtigen
- Kleine Länder, Territorien und neu unabhängig gewordene Nationen weisen oft unvollständige oder fehlende Daten auf
- Ranglisten spiegeln nur Länder wider, die Daten für einen bestimmten Zeitraum gemeldet haben – das Fehlen in einer Rangliste bedeutet nicht, dass der Wert null ist