Metodologi
Transparansi adalah inti dari misi Data Race. Halaman ini menjelaskan bagaimana statistik global dikumpulkan, diproses, dan disajikan. Data tidak dimodifikasi, diperkirakan, atau disunting — tujuannya adalah menyajikan angka-angka resmi setepat mungkin.
Pengumpulan Data
Semua data dikumpulkan secara terprogram dari API publik resmi dan penyedia data. Setiap dataset diambil menggunakan skrip Python yang terhubung langsung ke endpoint penyedia, memastikan reprodusibilitas dan keterlacakan. Tidak ada entri data manual yang terlibat.
- Mengambil data mentah dari API resmi dan penyedia data (World Bank Open Data, FAOSTAT, Yahoo Finance, dll.)
- Memvalidasi integritas respons — memeriksa bidang yang diharapkan, tipe data, dan kelengkapan
- Menyimpan data yang divalidasi dalam format tabel terstruktur untuk jalur pemrosesan
- Mencatat URL sumber, stempel waktu pengambilan, dan jumlah rekaman untuk setiap dataset
Pemrosesan Data
Data mentah melewati jalur pemrosesan yang deterministik. Setiap langkah diotomatisasi dan menghasilkan keluaran yang sama jika diberikan masukan yang sama. Interpolasi atau estimasi sengaja dihindari — jika titik data hilang dari sumbernya, titik tersebut tetap hilang di dataset.
- Identifikasi entitas — ISO 3166-1 alpha-3 untuk negara (misal: USA, JPN, DEU), simbol ticker untuk perusahaan (misal: AAPL, MSFT)
- Pengecualian nilai yang hilang — celah dipertahankan, tidak pernah diisi dengan perkiraan
- Klasifikasi regional menggunakan pemetaan tetap negara-negara ke dalam 13 wilayah geografis
- Perhitungan peringkat untuk setiap periode waktu — baik peringkat global maupun di dalam wilayah
- Keluaran ke format Apache Parquet untuk kueri berbasis peramban yang efisien
Perhitungan Peringkat
Peringkat dihitung ulang secara independen untuk setiap periode waktu. Hanya negara dengan data yang dilaporkan untuk periode spesifik tersebut yang dimasukkan dalam peringkat. Ini berarti peringkat suatu negara dapat berubah bukan hanya karena nilainya berubah, tetapi juga karena negara lain mulai atau berhenti melaporkan.
- Peringkat Global: Posisi di antara semua negara dengan data untuk periode spesifik tersebut
- Peringkat Regional: Posisi di dalam wilayah geografis yang ditetapkan untuk negara tersebut
- Perubahan Peringkat: Selisih dari posisi peringkat periode sebelumnya (positif = naik)
- Perubahan Tahun-ke-Tahun: Perubahan persentase pada nilai dasar dari periode sebelumnya
- Jenis Peringkat: Setiap dataset diklasifikasikan sebagai 'best' (lebih tinggi lebih baik, misal PDB), 'worst' (lebih tinggi lebih buruk, misal emisi CO2) atau 'neutral' (tidak ada arah yang melekat, misal populasi)
Visualisasi
Visualisasi berjalan sepenuhnya di peramban menggunakan DuckDB-Wasm untuk kueri SQL pada file Parquet. Tidak ada data yang dikirim ke server. Arsitektur ini memastikan waktu muat yang cepat, kemampuan luring, dan privasi data yang lengkap.
- Balapan Diagram Batang: Peringkat negara beranimasi yang menunjukkan bagaimana posisi berubah seiring waktu
- Diagram Garis: Deret waktu historis dengan keterangan alat arahkan interaktif untuk nilai terperinci
- Diagram Lingkaran: Analisis porsi proporsional yang menunjukkan bagaimana total global didistribusikan
- Peta Dunia: Peta panas geografis dengan skala berkode warna untuk pola spasial
- Tabel Data: Peringkat yang dapat diurutkan dengan nilai, perubahan peringkat, dan perbandingan tahun-ke-tahun
- Semua grafik mendukung penyaringan regional, penyematan negara, dan pemilihan rentang periode
Kualitas Data
Akurasi dan transparansi diprioritaskan di atas kelengkapan. Daripada mengisi celah dengan perkiraan, hanya ditampilkan apa yang dilaporkan oleh sumber resmi. Setiap visualisasi terhubung kembali ke sumber data aslinya sehingga pengguna dapat memverifikasi angka-angka dasarnya.
- Hanya menggunakan data dari organisasi dan penyedia data mapan dengan metodologi yang terdokumentasi
- Mempertahankan nilai asli persis seperti yang dilaporkan — tanpa pembulatan, penyesuaian, atau normalisasi
- Data yang hilang dikecualikan daripada diperkirakan atau diinterpolasi
- Setiap halaman dataset menampilkan organisasi sumber dan tautan langsung ke data aslinya
- Cakupan data (jumlah negara dan rentang waktu) ditampilkan di setiap visualisasi
Keterbatasan yang Diketahui
Tidak ada dataset yang sempurna. Pengguna harus mempertimbangkan keterbatasan ini saat menginterpretasikan visualisasi:
- Ketersediaan data sangat bervariasi menurut negara dan periode waktu — beberapa negara memiliki data dari tahun 1960, sementara yang lain hanya dari tahun 2000-an
- Organisasi sumber mungkin merevisi data historis secara retrospektif, yang berarti nilai di masa lalu dapat berubah di antara pembaruan
- Perubahan metodologis oleh organisasi sumber (misal: perubahan metode perhitungan PDB) dapat memengaruhi keterbandingan tahun-ke-tahun
- Negara-negara kecil, wilayah, dan negara yang baru merdeka sering kali memiliki data yang tidak lengkap atau hilang
- Peringkat hanya mencerminkan negara yang melaporkan data untuk periode tertentu — ketiadaan dalam peringkat bukan berarti nilainya nol