Metodoloji
Şeffaflık, Data Race'in misyonunun temelidir. Bu sayfa, küresel istatistiklerin nasıl toplandığını, işlendiğini ve sunulduğunu açıklamaktadır. Veriler değiştirilmez, tahmin edilmez veya editoryal olarak yorumlanmaz; amaç resmi rakamları mümkün olduğunca aslına sadık kalarak sunmaktır.
Veri Toplama
Tüm veriler, resmi genel API'ler ve veri sağlayıcılardan programatik olarak toplanmaktadır. Her veri seti, sağlayıcı uç noktalarına doğrudan bağlanan Python betikleri kullanılarak alınmakta; bu da yeniden üretilebilirlik ve izlenebilirliği sağlamaktadır. Hiçbir manuel veri girişi yapılmamaktadır.
- Resmi API'ler ve veri sağlayıcılarından (World Bank Open Data, FAOSTAT, Yahoo Finance vb.) ham verileri getirme
- Yanıt bütünlüğünü doğrulama — beklenen alanları, veri türlerini ve eksiksizliği kontrol etme
- İşleme ardışık düzeni için doğrulanmış verileri yapılandırılmış tablo formatında saklama
- Her veri kümesi için kaynak URL'sini, getirme zaman damgasını ve kayıt sayısını günlüğe kaydetme
Veri İşleme
Ham veriler deterministik bir işleme ardışık düzeninden geçer. Her adım otomatiktir ve aynı girdi verildiğinde aynı çıktıyı üretir. Enterpolasyon ve tahminden bilinçli olarak kaçınılır — eğer kaynaktan bir veri noktası eksikse, çıktı veri kümesinde de eksik kalır.
- Varlık tanımlama — ülkeler için ISO 3166-1 alpha-3 (örn. USA, JPN, DEU), şirketler için borsa sembolleri (örn. AAPL, MSFT)
- Eksik değerlerin hariç tutulması — boşluklar korunur, asla tahminlerle doldurulmaz
- Ülkelerin 13 coğrafi bölgeye sabit bir şekilde eşleştirilmesini kullanan bölgesel sınıflandırma
- Her zaman dilimi için sıralama hesaplaması — hem küresel hem de bölge içi sıralamalar
- Verimli tarayıcı tabanlı sorgulama için Apache Parquet formatına çıktı alma
Sıralama Hesaplaması
Sıralamalar her zaman dilimi için bağımsız olarak yeniden hesaplanır. Sadece o belirli dönem için veri bildiren ülkeler sıralamaya dahil edilir. Bu, bir ülkenin sıralamasının yalnızca kendi değeri değiştiği için değil, aynı zamanda diğer ülkelerin veri bildirmeye başlaması veya bildirmeyi bırakması nedeniyle de değişebileceği anlamına gelir.
- Küresel Sıralama: O belirli dönem için verisi olan tüm ülkeler arasındaki konumu
- Bölgesel Sıralama: Ülkenin atandığı coğrafi bölge içindeki konumu
- Sıralama Değişimi: Önceki dönemin sıralama konumundan farkı (pozitif = yükseldi)
- Yıllık Değişim: Önceki döneme göre temel değerdeki yüzde değişimi
- Sıralama Türü: Her veri kümesi 'best' (daha yüksek olması daha iyi, örn. GSYİH), 'worst' (daha yüksek olması daha kötü, örn. CO2 emisyonları) veya 'neutral' (doğal bir yönü yok, örn. nüfus) olarak sınıflandırılır
Görselleştirme
Görselleştirmeler, Parquet dosyaları üzerinde SQL sorguları için DuckDB-Wasm kullanılarak tamamen tarayıcıda çalışır. Herhangi bir sunucuya veri gönderilmez. Bu mimari, hızlı yükleme süreleri, çevrimdışı kullanım yeteneği ve tam veri gizliliği sağlar.
- Çubuk Grafik Yarışı: Konumların zaman içinde nasıl değiştiğini gösteren animasyonlu ülke sıralamaları
- Çizgi Grafik: Ayrıntılı değerler için etkileşimli vurgulu ipuçlarına sahip tarihsel zaman serileri
- Pasta Grafik: Küresel toplamın nasıl dağıldığını gösteren orantısal pay analizi
- Dünya Haritası: Mekansal desenler için renk kodlu ölçeklere sahip coğrafi ısı haritası
- Veri Tablosu: Değerler, sıralama değişiklikleri ve yıllık karşılaştırmalar içeren sıralanabilir listeler
- Tüm grafikler bölgesel filtrelemeyi, ülkeleri sabitlemeyi ve dönem aralığı seçimini destekler
Veri Kalitesi
Eksiksizlik yerine doğruluğa ve şeffaflığa öncelik veriyoruz. Boşlukları tahminlerle doldurmak yerine, yalnızca resmi kaynakların bildirdiklerini gösteriyoruz. Her görselleştirme, kullanıcıların temel sayıları doğrulayabilmesi için orijinal veri kaynağına geri döner.
- Yalnızca belgelenmiş metodolojilere sahip köklü organizasyonların ve veri sağlayıcılarının verilerini kullanma
- Orijinal değerleri tam olarak bildirildiği gibi koruma — yuvarlama, ayarlama veya normalleştirme yok
- Eksik veriler tahmin edilmek veya enterpole edilmek yerine hariç tutulur
- Her veri kümesi sayfası, kaynak kuruluşu ve orijinal verilere doğrudan bir bağlantı görüntüler
- Veri kapsamı (ülke sayısı ve zaman aralığı) her görselleştirmede gösterilir
Bilinen Sınırlamalar
Hiçbir veri kümesi mükemmel değildir. Kullanıcılar görselleştirmeleri yorumlarken şu sınırlamaları dikkate almalıdır:
- Veri kullanılabilirliği ülkeye ve zaman dilimine göre önemli ölçüde değişir; bazı ülkelerin 1960'tan itibaren verisi varken, diğerlerinin yalnızca 2000'lerden itibaren vardır
- Kaynak kuruluşlar geçmiş verileri geriye dönük olarak revize edebilir, bu da geçmiş değerlerin güncellemeler arasında değişebileceği anlamına gelir
- Kaynak kuruluşlar tarafından yapılan metodolojik değişiklikler (örn. GSYİH hesaplama yöntemi değişiklikleri), yıllık karşılaştırılabilirliği etkileyebilir
- Küçük ülkeler, bölgeler ve yeni bağımsızlığını kazanmış ülkeler genellikle eksik verilere sahiptir
- Sıralamalar yalnızca belirli bir dönem için veri bildiren ülkeleri yansıtır; sıralamada yer almamak değerin sıfır olduğu anlamına gelmez