メソドロジー

透明性はData Raceの根幹です。このページでは、世界的な統計データの収集・処理・提示の方法を説明します。データの変更、推計、編集は行いません。公式の数値を可能な限り忠実に提示することを目指しています。

データ収集

すべてのデータは、公式の公開APIおよびデータプロバイダーからプログラムによって収集されます。各データセットは、提供者のエンドポイントに直接接続するPythonスクリプトを使用して取得され、再現性と追跡可能性を確保しています。手作業によるデータ入力は一切含まれていません。

生データは決定論的な処理パイプラインを経ます。各ステップは自動化されており、同じ入力であれば同じ出力が生成されます。補間や推計は意図的に避けています。ソースにデータポイントが欠損している場合、データセットでも欠損したままになります。

順位は各期間について独立して再計算されます。その特定の期間のデータを報告した国のみが順位に含まれます。つまり、ある国の順位が変わるのは、その国の値が変化したためだけでなく、他の国が報告を開始または停止したためである可能性もあります。

世界順位: その特定の期間のデータを持つすべての国の中での位置
地域順位: その国が割り当てられた地理的地域内での位置
順位の変動: 前回の期間の順位位置からの差（プラス = 上昇）
前年比の変動: 前回の期間からの基礎となる値のパーセンテージ変化
順位タイプ: 各データセットは、'best'（高いほど良い、例: GDP）、'worst'（高いほど悪い、例: CO2排出量）、または'neutral'（固有の方向性なし、例: 人口）に分類されます

可視化は完全にブラウザ内で実行され、Parquetファイル上のSQLクエリにDuckDB-Wasmを使用します。サーバーにデータは送信されません。このアーキテクチャにより、高速な読み込み時間、オフライン機能、および完全なデータプライバシーが保証されます。

私たちは完全性よりも正確性と透明性を優先します。推計で空白を埋めるのではなく、公式ソースが報告したものだけを表示します。すべての可視化は元のデータソースにリンクされているため、ユーザーは基礎となる数値を確認できます。

完璧なデータセットはありません。ユーザーは可視化を解釈する際、以下の制限事項を考慮する必要があります：