Data Race

方法论

我们如何处理和可视化数据

透明度是我们使命的核心。本页解释了我们如何收集、处理和呈现全球统计数据。

数据收集

我们通过源 API 以编程方式收集数据:

  1. 从数据提供商(世界银行、粮农组织等)获取原始数据
  2. 验证数据的完整性和格式
  3. 以结构化格式存储数据以供处理

数据处理

原始数据经过几个处理步骤:

  1. 国家代码标准化
  2. 排除缺失值(不插值)
  3. 分配区域分类
  4. 计算排名(全球和区域)

排名计算

每年独立计算排名:

  • 全球排名:在当年有数据的所有国家中的位置
  • 区域排名:在指定区域内的位置
  • 排名变化:与上一年排名位置的差异
  • 同比变化:与上一年数值的百分比变化

可视化

我们的可视化构建考虑了性能和可访问性:

  • 条形图:带有平滑过渡的动画排名
  • 折线图:带有交互式工具提示的历史趋势
  • 饼图:市场份额和构成分析
  • 适用于所有屏幕尺寸的响应式设计

数据质量

我们采取多种措施确保数据质量:

  • 优先选择可靠、文档齐全的数据源
  • 保留原始值不作修改
  • 缺失数据被排除而不是估算
  • 清楚地指出数据差距和局限性

已知局限性

用户应注意这些局限性:

  • 数据可用性因国家和年份而异
  • 一些国家可能历史数据不完整
  • 源组织的方法论变更可能会影响可比性
  • 经济数据可能被源组织修订
  • 小国或地区可能缺乏数据