Metodología
La transparencia es fundamental en Data Race. Esta página explica cómo se recopilan, procesan y presentan las estadísticas globales. Los datos no se modifican, estiman ni comentan; el objetivo es presentar las cifras oficiales de la manera más fiel posible.
Recopilación de Datos
Todos los datos se recopilan programáticamente a partir de las API públicas oficiales y proveedores de datos. Cada conjunto de datos se obtiene mediante scripts de Python que se conectan directamente a los endpoints de los proveedores, garantizando la reproducibilidad y trazabilidad. No se realiza ninguna introducción manual de datos.
- Obtención de datos sin procesar de APIs oficiales y proveedores de datos (World Bank Open Data, FAOSTAT, Yahoo Finance, etc.)
- Validación de la integridad de la respuesta: comprobación de los campos esperados, los tipos de datos y la completitud
- Almacenamiento de datos validados en formato tabular estructurado para el flujo de procesamiento
- Registro de la URL de origen, la marca de tiempo de la extracción y el número de registros para cada conjunto de datos
Procesamiento de Datos
Los datos sin procesar se someten a un flujo de procesamiento determinista. Cada paso está automatizado y produce el mismo resultado con la misma entrada. La interpolación y la estimación se evitan de forma deliberada: si falta un punto de datos en la fuente, también falta en el conjunto de datos.
- Identificación de entidades — ISO 3166-1 alpha-3 para países (ej. USA, JPN, DEU), símbolos de cotización para empresas (ej. AAPL, MSFT)
- Exclusión de valores faltantes: los vacíos se conservan, nunca se llenan con estimaciones
- Clasificación regional mediante un mapeo fijo de países a 13 regiones geográficas
- Cálculo de clasificación para cada período de tiempo: clasificaciones globales y dentro de la región
- Salida a formato Apache Parquet para consultas eficientes en el navegador
Cálculo de Clasificación
Las clasificaciones se recalculan independientemente para cada período de tiempo. Solo los países con datos informados para ese período específico se incluyen en la clasificación. Esto significa que la clasificación de un país puede cambiar no solo porque su valor cambió, sino también porque otros países comenzaron o dejaron de informar.
- Clasificación Global: Posición entre todos los países con datos para ese período específico
- Clasificación Regional: Posición dentro de la región geográfica asignada al país
- Cambio de Clasificación: Diferencia con respecto a la posición de clasificación del período anterior (positivo = subió)
- Cambio Interanual: Cambio porcentual en el valor subyacente respecto al período anterior
- Tipo de Clasificación: Cada conjunto de datos se clasifica como 'best' (mayor es mejor, ej. PIB), 'worst' (mayor es peor, ej. emisiones de CO2) o 'neutral' (sin dirección inherente, ej. población)
Visualización
Las visualizaciones se ejecutan completamente en el navegador utilizando DuckDB-Wasm para consultas SQL en archivos Parquet. No se envían datos a un servidor. Esta arquitectura garantiza tiempos de carga rápidos, capacidad sin conexión y total privacidad de los datos.
- Carrera de Gráficos de Barras: Clasificaciones animadas de países que muestran cómo cambian las posiciones con el tiempo
- Gráfico de Líneas: Series de tiempo históricas con información sobre herramientas interactiva para valores detallados
- Gráfico Circular: Análisis de participación proporcional que muestra cómo se distribuye el total global
- Mapa Mundial: Mapa de calor geográfico con escalas codificadas por colores para patrones espaciales
- Tabla de Datos: Clasificaciones ordenables con valores, cambios de clasificación y comparaciones interanuales
- Todos los gráficos admiten filtrado regional, fijación de países y selección de rango de períodos
Calidad de los Datos
Priorizamos la precisión y la transparencia sobre la completitud. En lugar de llenar los vacíos con estimaciones, solo mostramos lo que informan las fuentes oficiales. Cada visualización enlaza a su fuente de datos original para que los usuarios puedan verificar los números subyacentes.
- Solo se utilizan datos de organizaciones y proveedores de datos establecidos con metodologías documentadas
- Se conservan los valores originales exactamente como se informaron: sin redondeos, ajustes ni normalización
- Los datos faltantes se excluyen en lugar de estimarse o interpolarse
- Cada página de conjunto de datos muestra la organización de origen y un enlace directo a los datos originales
- La cobertura de datos (número de países y rango de tiempo) se muestra en cada visualización
Limitaciones Conocidas
Ningún conjunto de datos es perfecto. Los usuarios deben considerar estas limitaciones al interpretar las visualizaciones:
- La disponibilidad de datos varía significativamente según el país y el período de tiempo: algunas naciones tienen datos desde 1960, mientras que otras solo desde la década de 2000
- Las organizaciones de origen pueden revisar los datos históricos de forma retroactiva, lo que significa que los valores pasados pueden cambiar entre actualizaciones
- Los cambios metodológicos por parte de las organizaciones de origen (ej. cambios en el método de cálculo del PIB) pueden afectar la comparabilidad interanual
- Los países pequeños, los territorios y las naciones recién independizadas a menudo tienen datos incompletos o faltantes
- Las clasificaciones reflejan solo los países que informaron datos para un período determinado: la ausencia de una clasificación no significa valor cero