Metodoloji
Şeffaflık, Data Race'in misyonunun temelidir. Bu sayfa, küresel istatistiklerin nasıl toplandığını, işlendiğini ve sunulduğunu açıklamaktadır. Veriler değiştirilmez, tahmin edilmez veya editoryal olarak yorumlanmaz; amaç resmi rakamları mümkün olduğunca aslına sadık kalarak sunmaktır.
Veri Toplama
Tüm veriler, resmi genel API'ler ve veri sağlayıcılardan programatik olarak toplanmaktadır. Her veri seti, sağlayıcı uç noktalarına doğrudan bağlanan Python betikleri kullanılarak alınmakta; bu da yeniden üretilebilirlik ve izlenebilirliği sağlamaktadır. Hiçbir manuel veri girişi yapılmamaktadır.
- Resmi API'ler ve veri sağlayıcılarından (World Bank Open Data, FAOSTAT, Yahoo Finance vb.) ham verileri getirme
- Yanıt bütünlüğünü doğrulama — beklenen alanları, veri türlerini ve eksiksizliği kontrol etme
- İşleme ardışık düzeni için doğrulanmış verileri yapılandırılmış tablo formatında saklama
- Her veri kümesi için kaynak URL'sini, getirme zaman damgasını ve kayıt sayısını günlüğe kaydetme
Veri İşleme
Ham veriler deterministik bir işleme ardışık düzeninden geçer. Her adım otomatiktir ve aynı girdi verildiğinde aynı çıktıyı üretir. Enterpolasyon ve tahminden bilinçli olarak kaçınılır — eğer kaynaktan bir veri noktası eksikse, çıktı veri kümesinde de eksik kalır.
- Varlık tanımlama — ülkeler için ISO 3166-1 alpha-3 (örn. USA, JPN, DEU), şirketler için borsa sembolleri (örn. AAPL, MSFT)
- Eksik değerlerin hariç tutulması — boşluklar korunur, asla tahminlerle doldurulmaz
- Ülkelerin 13 coğrafi bölgeye sabit bir şekilde eşleştirilmesini kullanan bölgesel sınıflandırma
- Her zaman dilimi için sıralama hesaplaması — hem küresel hem de bölge içi sıralamalar
- Tarayıcı kullanımı için yapılandırılmış veri dosyalarına çıktı
Sıralama Hesaplaması
Sıralamalar her zaman dilimi için bağımsız olarak yeniden hesaplanır. Sadece o belirli dönem için veri bildiren ülkeler sıralamaya dahil edilir. Bu, bir ülkenin sıralamasının yalnızca kendi değeri değiştiği için değil, aynı zamanda diğer ülkelerin veri bildirmeye başlaması veya bildirmeyi bırakması nedeniyle de değişebileceği anlamına gelir.
- Küresel Sıralama: O belirli dönem için verisi olan tüm ülkeler arasındaki konumu
- Bölgesel Sıralama: Ülkenin atandığı coğrafi bölge içindeki konumu
- Sıralama Değişimi: Önceki dönemin sıralama konumundan farkı (pozitif = yükseldi)
- Yıllık Değişim: Önceki döneme göre temel değerdeki yüzde değişimi
- Sıralama Türü: Her veri kümesi 'best' (daha yüksek olması daha iyi, örn. GSYİH), 'worst' (daha yüksek olması daha kötü, örn. CO2 emisyonları) veya 'neutral' (doğal bir yönü yok, örn. nüfus) olarak sınıflandırılır
Veri Kalitesi
Data Race, eksiksizlik yerine doğruluğa ve şeffaflığa öncelik veriyor. Boşlukları tahminlerle doldurmak yerine, Data Race yalnızca resmi kaynakların bildirdiklerini gösteriyor. Her görselleştirme, kullanıcıların temel sayıları doğrulayabilmesi için orijinal veri kaynağına geri döner.
- Yalnızca belgelenmiş metodolojilere sahip köklü organizasyonların ve veri sağlayıcılarının verilerini kullanma
- Orijinal değerleri tam olarak bildirildiği gibi koruma — yuvarlama, ayarlama veya normalleştirme yok
- Eksik veriler tahmin edilmek veya enterpole edilmek yerine hariç tutulur
- Her veri kümesi sayfası, kaynak kuruluşu ve orijinal verilere doğrudan bir bağlantı görüntüler
- Veri kapsamı (ülke sayısı ve zaman aralığı) her görselleştirmede gösterilir
Bilinen Sınırlamalar
Hiçbir veri kümesi mükemmel değildir. Kullanıcılar görselleştirmeleri yorumlarken şu sınırlamaları dikkate almalıdır:
- Veri kullanılabilirliği ülkeye ve zaman dilimine göre önemli ölçüde değişir; bazı ülkelerin 1960'tan itibaren verisi varken, diğerlerinin yalnızca 2000'lerden itibaren vardır
- Kaynak kuruluşlar geçmiş verileri geriye dönük olarak revize edebilir, bu da geçmiş değerlerin güncellemeler arasında değişebileceği anlamına gelir
- Kaynak kuruluşlar tarafından yapılan metodolojik değişiklikler (örn. GSYİH hesaplama yöntemi değişiklikleri), yıllık karşılaştırılabilirliği etkileyebilir
- Küçük ülkeler, bölgeler ve yeni bağımsızlığını kazanmış ülkeler genellikle eksik verilere sahiptir
- Sıralamalar yalnızca belirli bir dönem için veri bildiren ülkeleri yansıtır; sıralamada yer almamak değerin sıfır olduğu anlamına gelmez