Data Race

المنهجية

كيف نعالج البيانات ونعرضها

الشفافية هي جوهر مهمتنا. تشرح هذه الصفحة كيف نجمع ونعالج ونقدم الإحصائيات العالمية.

جمع البيانات

نستخدم خطوط أنابيب ETL (استخراج، تحويل، تحميل) مكتوبة بلغة Python لجمع البيانات من واجهات برمجة التطبيقات الرسمية:

  1. جلب البيانات الخام من واجهات برمجة التطبيقات المصدر (البنك الدولي، FAO، إلخ)
  2. التحقق من اكتمال البيانات وتنسيقها
  3. تخزين البيانات الخام بتنسيق منظم للمعالجة

معالجة البيانات

تمر البيانات الخام بعدة خطوات معالجة:

  1. توحيد رموز الدول (ISO 3166-1 alpha-3)
  2. استبعاد القيم المفقودة (يتم حذف الصفوف بدون قيم، بدون استيفاء)
  3. تطبيع الوحدات عند الاقتضاء
  4. تعيين التصنيف الإقليمي
  5. حساب الترتيب (عالمي وإقليمي)

حساب الترتيب

يتم حساب الترتيب لكل سنة بشكل مستقل:

  • الترتيب العالمي: الموقع بين جميع الدول التي لديها بيانات لتلك السنة
  • الترتيب الإقليمي: الموقع ضمن المنطقة المعينة
  • تغير الترتيب: الفرق عن السنة السابقة (موجب = تحسن)
  • التغير السنوي: نسبة التغير في القيمة عن السنة السابقة

التصور

تم بناء تصوراتنا مع مراعاة الأداء وسهولة الوصول:

  • سباق الرسم البياني الشريطي: عرض قائم على Canvas لرسوم متحركة سلسة بمعدل 60 إطاراً في الثانية
  • الرسم البياني الخطي: قائم على SVG مع تلميحات تفاعلية
  • تصميم متجاوب لجميع أحجام الشاشات
  • استيفاء البيانات للانتقالات السلسة بين السنوات

جودة البيانات

نتخذ عدة تدابير لضمان جودة البيانات:

  • استخدام مصادر بيانات رسمية وموثوقة فقط
  • الحفاظ على القيم الأصلية دون تعديل
  • يتم استبعاد البيانات المفقودة بدلاً من تقديرها — لا يتم تطبيق أي استيفاء أو إسناد
  • التغيرات السنوية وتغيرات الترتيب تكون صفراً افتراضياً للسنة الأولى المتاحة للدولة
  • الإشارة بوضوح إلى الفجوات والقيود في البيانات
  • توثيق جميع خطوات المعالجة

القيود المعروفة

يجب أن يكون المستخدمون على دراية بهذه القيود:

  • يختلف توفر البيانات حسب الدولة والسنة
  • قد تكون لدى بعض الدول بيانات تاريخية غير مكتملة
  • قد تؤثر التغييرات المنهجية من المنظمات المصدر على قابلية المقارنة
  • قد يتم مراجعة البيانات الاقتصادية من قبل المنظمات المصدر
  • قد تفتقر الدول أو الأقاليم الصغيرة إلى البيانات