ระเบียบวิธี
ความโปร่งใสคือหัวใจหลักของภารกิจ Data Race หน้านี้อธิบายว่าข้อมูลถูกรวบรวม ประมวลผล และนำเสนออย่างไร ข้อมูลจะไม่ถูกแก้ไข คาดคะเน หรือแสดงความคิดเห็น — เป้าหมายคือการนำเสนอตัวเลขอย่างเป็นทางการให้ตรงกับความเป็นจริงมากที่สุด
การรวบรวมข้อมูล
ข้อมูลทั้งหมดถูกรวบรวมตามโปรแกรมจาก API สาธารณะอย่างเป็นทางการและผู้ให้บริการข้อมูล สคริปต์ Python เชื่อมต่อโดยตรงกับ endpoint ของผู้ให้บริการ ทำให้มั่นใจได้ถึงความสามารถในการทำซ้ำและการตรวจสอบย้อนหลัง ไม่มีการป้อนข้อมูลด้วยตนเอง
- ดึงข้อมูลดิบจาก API อย่างเป็นทางการและผู้ให้บริการข้อมูล (World Bank Open Data, FAOSTAT, Yahoo Finance ฯลฯ)
- ตรวจสอบความสมบูรณ์ของการตอบกลับ — ตรวจสอบฟิลด์ที่คาดหวัง ประเภทข้อมูล และความสมบูรณ์
- จัดเก็บข้อมูลที่ผ่านการตรวจสอบแล้วในรูปแบบตารางที่มีโครงสร้างสำหรับไปป์ไลน์การประมวลผล
- บันทึก URL แหล่งที่มา เวลาที่ดึงข้อมูล และจำนวนระเบียนสำหรับชุดข้อมูลแต่ละชุด
การประมวลผลข้อมูล
ข้อมูลดิบต้องผ่านไปป์ไลน์การประมวลผลแบบกำหนดค่าได้ แต่ละขั้นตอนทำงานอัตโนมัติและให้ผลลัพธ์แบบเดียวกันเมื่อได้รับข้อมูลนำเข้าแบบเดียวกัน การประมาณค่าในช่วงหรือการคาดคะเนจะถูกหลีกเลี่ยงอย่างตั้งใจ — หากจุดข้อมูลใดหายไปจากแหล่งที่มา จุดข้อมูลนั้นก็จะยังคงหายไปในชุดข้อมูลผลลัพธ์
- การระบุตัวตน — รหัส ISO 3166-1 alpha-3 สำหรับประเทศ (เช่น USA, JPN, DEU) และสัญลักษณ์ ticker สำหรับบริษัท (เช่น AAPL, MSFT)
- การยกเว้นค่าที่หายไป — ช่องว่างจะถูกเก็บรักษาไว้ จะไม่มีการเติมด้วยค่าประมาณ
- การจัดกลุ่มตามภูมิภาคโดยใช้การทำแผนที่แบบคงที่ของประเทศต่างๆ ไปยัง 13 ภูมิภาคทางภูมิศาสตร์
- การคำนวณอันดับสำหรับแต่ละช่วงเวลา — ทั้งอันดับโลกและอันดับภายในภูมิภาค
- ส่งออกเป็นไฟล์ข้อมูลที่มีโครงสร้างสำหรับการใช้งานในเบราว์เซอร์
การคำนวณอันดับ
อันดับจะถูกคำนวณใหม่โดยอิสระสำหรับแต่ละช่วงเวลา จะรวมเฉพาะประเทศที่มีข้อมูลรายงานสำหรับช่วงเวลาที่ระบุนั้นไว้ในการจัดอันดับ ซึ่งหมายความว่าอันดับของประเทศอาจเปลี่ยนแปลงได้ ไม่เพียงแต่เพราะค่าของประเทศเปลี่ยนไป แต่ยังเป็นเพราะประเทศอื่นเริ่มหรือหยุดรายงานข้อมูลด้วย
- อันดับโลก: ตำแหน่งในหมู่ประเทศทั้งหมดที่มีข้อมูลสำหรับช่วงเวลาที่ระบุนั้น
- อันดับภูมิภาค: ตำแหน่งภายในภูมิภาคทางภูมิศาสตร์ที่กำหนดของประเทศ
- การเปลี่ยนแปลงอันดับ: ความแตกต่างจากตำแหน่งอันดับของงวดก่อนหน้า (บวก = ขยับขึ้น)
- การเปลี่ยนแปลงแบบปีต่อปี: การเปลี่ยนแปลงเปอร์เซ็นต์ในค่าอ้างอิงจากช่วงเวลาก่อนหน้า
- ประเภทการจัดอันดับ: ชุดข้อมูลแต่ละชุดจะถูกจัดประเภทเป็น 'best' (ยิ่งสูงยิ่งดี เช่น GDP), 'worst' (ยิ่งสูงยิ่งแย่ เช่น การปล่อยก๊าซ CO2) หรือ 'neutral' (ไม่มีทิศทางที่แน่นอน เช่น จำนวนประชากร)
คุณภาพข้อมูล
Data Race ให้ความสำคัญกับความถูกต้องและความโปร่งใสมากกว่าความสมบูรณ์ แทนที่จะเติมช่องว่างด้วยค่าประมาณ Data Race แสดงเฉพาะสิ่งที่แหล่งข้อมูลทางการรายงานเท่านั้น การแสดงภาพแต่ละรายการจะเชื่อมโยงกลับไปยังแหล่งข้อมูลดั้งเดิม เพื่อให้ผู้ใช้สามารถตรวจสอบตัวเลขพื้นฐานได้
- ใช้เฉพาะข้อมูลจากองค์กรและผู้ให้บริการข้อมูลที่มีชื่อเสียงซึ่งมีระเบียบวิธีที่บันทึกไว้เท่านั้น
- รักษาค่าดั้งเดิมให้ตรงตามที่รายงาน — ไม่มีการปัดเศษ การปรับเปลี่ยน หรือการปรับมาตรฐาน
- ข้อมูลที่ขาดหายไปจะถูกยกเว้นแทนที่จะประมาณการหรือประมาณค่าในช่วง
- หน้าชุดข้อมูลแต่ละหน้าจะแสดงองค์กรที่เป็นแหล่งที่มาและลิงก์โดยตรงไปยังข้อมูลดั้งเดิม
- ความครอบคลุมของข้อมูล (จำนวนประเทศและช่วงเวลา) จะแสดงในการแสดงภาพทุกครั้ง
ข้อจำกัดที่ทราบ
ไม่มีชุดข้อมูลใดที่สมบูรณ์แบบ ผู้ใช้ควรพิจารณาข้อจำกัดเหล่านี้เมื่อตีความการแสดงภาพข้อมูล:
- ความพร้อมใช้งานของข้อมูลแตกต่างกันอย่างมากตามประเทศและช่วงเวลา — บางประเทศมีข้อมูลตั้งแต่ปี 1960 ในขณะที่ประเทศอื่นมีเพียงข้อมูลตั้งแต่ทศวรรษที่ 2000 เท่านั้น
- องค์กรที่เป็นแหล่งที่มาอาจปรับแก้ข้อมูลย้อนหลัง ซึ่งหมายความว่าค่าในอดีตอาจมีการเปลี่ยนแปลงระหว่างการอัปเดต
- การเปลี่ยนแปลงระเบียบวิธีโดยองค์กรที่เป็นแหล่งที่มา (เช่น การเปลี่ยนแปลงวิธีการคำนวณ GDP) อาจส่งผลต่อความสามารถในการเปรียบเทียบแบบปีต่อปี
- ประเทศเล็กๆ ดินแดน และประเทศเอกราชใหม่มักมีข้อมูลที่ไม่สมบูรณ์หรือขาดหายไป
- อันดับจะสะท้อนเฉพาะประเทศที่รายงานข้อมูลสำหรับช่วงเวลาที่กำหนด — การไม่อยู่ในการจัดอันดับไม่ได้หมายความว่ามีค่าเป็นศูนย์