ระเบียบวิธี
ความโปร่งใสคือหัวใจหลักของภารกิจ Data Race หน้านี้อธิบายว่าข้อมูลถูกรวบรวม ประมวลผล และนำเสนออย่างไร ข้อมูลจะไม่ถูกแก้ไข คาดคะเน หรือแสดงความคิดเห็น — เป้าหมายคือการนำเสนอตัวเลขอย่างเป็นทางการให้ตรงกับความเป็นจริงมากที่สุด
การรวบรวมข้อมูล
ข้อมูลทั้งหมดถูกรวบรวมตามโปรแกรมจาก API สาธารณะอย่างเป็นทางการและผู้ให้บริการข้อมูล สคริปต์ Python เชื่อมต่อโดยตรงกับ endpoint ของผู้ให้บริการ ทำให้มั่นใจได้ถึงความสามารถในการทำซ้ำและการตรวจสอบย้อนหลัง ไม่มีการป้อนข้อมูลด้วยตนเอง
- ดึงข้อมูลดิบจาก API อย่างเป็นทางการและผู้ให้บริการข้อมูล (World Bank Open Data, FAOSTAT, Yahoo Finance ฯลฯ)
- ตรวจสอบความสมบูรณ์ของการตอบกลับ — ตรวจสอบฟิลด์ที่คาดหวัง ประเภทข้อมูล และความสมบูรณ์
- จัดเก็บข้อมูลที่ผ่านการตรวจสอบแล้วในรูปแบบตารางที่มีโครงสร้างสำหรับไปป์ไลน์การประมวลผล
- บันทึก URL แหล่งที่มา เวลาที่ดึงข้อมูล และจำนวนระเบียนสำหรับชุดข้อมูลแต่ละชุด
การประมวลผลข้อมูล
ข้อมูลดิบต้องผ่านไปป์ไลน์การประมวลผลแบบกำหนดค่าได้ แต่ละขั้นตอนทำงานอัตโนมัติและให้ผลลัพธ์แบบเดียวกันเมื่อได้รับข้อมูลนำเข้าแบบเดียวกัน การประมาณค่าในช่วงหรือการคาดคะเนจะถูกหลีกเลี่ยงอย่างตั้งใจ — หากจุดข้อมูลใดหายไปจากแหล่งที่มา จุดข้อมูลนั้นก็จะยังคงหายไปในชุดข้อมูลผลลัพธ์
- การระบุตัวตน — รหัส ISO 3166-1 alpha-3 สำหรับประเทศ (เช่น USA, JPN, DEU) และสัญลักษณ์ ticker สำหรับบริษัท (เช่น AAPL, MSFT)
- การยกเว้นค่าที่หายไป — ช่องว่างจะถูกเก็บรักษาไว้ จะไม่มีการเติมด้วยค่าประมาณ
- การจัดกลุ่มตามภูมิภาคโดยใช้การทำแผนที่แบบคงที่ของประเทศต่างๆ ไปยัง 13 ภูมิภาคทางภูมิศาสตร์
- การคำนวณอันดับสำหรับแต่ละช่วงเวลา — ทั้งอันดับโลกและอันดับภายในภูมิภาค
- ส่งออกเป็นรูปแบบ Apache Parquet สำหรับการสืบค้นผ่านเบราว์เซอร์ที่มีประสิทธิภาพ
การคำนวณอันดับ
อันดับจะถูกคำนวณใหม่โดยอิสระสำหรับแต่ละช่วงเวลา จะรวมเฉพาะประเทศที่มีข้อมูลรายงานสำหรับช่วงเวลาที่ระบุนั้นไว้ในการจัดอันดับ ซึ่งหมายความว่าอันดับของประเทศอาจเปลี่ยนแปลงได้ ไม่เพียงแต่เพราะค่าของประเทศเปลี่ยนไป แต่ยังเป็นเพราะประเทศอื่นเริ่มหรือหยุดรายงานข้อมูลด้วย
- อันดับโลก: ตำแหน่งในหมู่ประเทศทั้งหมดที่มีข้อมูลสำหรับช่วงเวลาที่ระบุนั้น
- อันดับภูมิภาค: ตำแหน่งภายในภูมิภาคทางภูมิศาสตร์ที่กำหนดของประเทศ
- การเปลี่ยนแปลงอันดับ: ความแตกต่างจากตำแหน่งอันดับของงวดก่อนหน้า (บวก = ขยับขึ้น)
- การเปลี่ยนแปลงแบบปีต่อปี: การเปลี่ยนแปลงเปอร์เซ็นต์ในค่าอ้างอิงจากช่วงเวลาก่อนหน้า
- ประเภทการจัดอันดับ: ชุดข้อมูลแต่ละชุดจะถูกจัดประเภทเป็น 'best' (ยิ่งสูงยิ่งดี เช่น GDP), 'worst' (ยิ่งสูงยิ่งแย่ เช่น การปล่อยก๊าซ CO2) หรือ 'neutral' (ไม่มีทิศทางที่แน่นอน เช่น จำนวนประชากร)
การแสดงภาพข้อมูล
การแสดงภาพข้อมูลทำงานทั้งหมดในเบราว์เซอร์โดยใช้ DuckDB-Wasm สำหรับการสืบค้น SQL บนไฟล์ Parquet ไม่มีการส่งข้อมูลไปยังเซิร์ฟเวอร์ สถาปัตยกรรมนี้ช่วยให้มั่นใจได้ถึงเวลาในการโหลดที่รวดเร็ว ความสามารถในการใช้งานแบบออฟไลน์ และความเป็นส่วนตัวของข้อมูลโดยสมบูรณ์
- การแข่งกราฟแท่ง: การจัดอันดับประเทศแบบแอนิเมชันแสดงให้เห็นว่าตำแหน่งเปลี่ยนแปลงไปอย่างไรเมื่อเวลาผ่านไป
- กราฟเส้น: อนุกรมเวลาในอดีตพร้อมเคล็ดลับเครื่องมือแบบโต้ตอบเมื่อชี้เมาส์สำหรับค่าโดยละเอียด
- แผนภูมิพาย: การวิเคราะห์สัดส่วนที่แสดงให้เห็นถึงวิธีการแจกแจงยอดรวมทั่วโลก
- แผนที่โลก: แผนที่ความร้อนทางภูมิศาสตร์พร้อมมาตราส่วนรหัสสีสำหรับรูปแบบเชิงพื้นที่
- ตารางข้อมูล: การจัดอันดับที่เรียงลำดับได้พร้อมค่า การเปลี่ยนแปลงอันดับ และการเปรียบเทียบแบบปีต่อปี
- แผนภูมิทั้งหมดรองรับการกรองตามภูมิภาค การปักหมุดประเทศ และการเลือกช่วงเวลา
คุณภาพข้อมูล
เราให้ความสำคัญกับความถูกต้องและความโปร่งใสมากกว่าความสมบูรณ์ แทนที่จะเติมช่องว่างด้วยค่าประมาณ เราแสดงเฉพาะสิ่งที่แหล่งข้อมูลทางการรายงานเท่านั้น การแสดงภาพแต่ละรายการจะเชื่อมโยงกลับไปยังแหล่งข้อมูลดั้งเดิม เพื่อให้ผู้ใช้สามารถตรวจสอบตัวเลขพื้นฐานได้
- ใช้เฉพาะข้อมูลจากองค์กรและผู้ให้บริการข้อมูลที่มีชื่อเสียงซึ่งมีระเบียบวิธีที่บันทึกไว้เท่านั้น
- รักษาค่าดั้งเดิมให้ตรงตามที่รายงาน — ไม่มีการปัดเศษ การปรับเปลี่ยน หรือการปรับมาตรฐาน
- ข้อมูลที่ขาดหายไปจะถูกยกเว้นแทนที่จะประมาณการหรือประมาณค่าในช่วง
- หน้าชุดข้อมูลแต่ละหน้าจะแสดงองค์กรที่เป็นแหล่งที่มาและลิงก์โดยตรงไปยังข้อมูลดั้งเดิม
- ความครอบคลุมของข้อมูล (จำนวนประเทศและช่วงเวลา) จะแสดงในการแสดงภาพทุกครั้ง
ข้อจำกัดที่ทราบ
ไม่มีชุดข้อมูลใดที่สมบูรณ์แบบ ผู้ใช้ควรพิจารณาข้อจำกัดเหล่านี้เมื่อตีความการแสดงภาพข้อมูล:
- ความพร้อมใช้งานของข้อมูลแตกต่างกันอย่างมากตามประเทศและช่วงเวลา — บางประเทศมีข้อมูลตั้งแต่ปี 1960 ในขณะที่ประเทศอื่นมีเพียงข้อมูลตั้งแต่ทศวรรษที่ 2000 เท่านั้น
- องค์กรที่เป็นแหล่งที่มาอาจปรับแก้ข้อมูลย้อนหลัง ซึ่งหมายความว่าค่าในอดีตอาจมีการเปลี่ยนแปลงระหว่างการอัปเดต
- การเปลี่ยนแปลงระเบียบวิธีโดยองค์กรที่เป็นแหล่งที่มา (เช่น การเปลี่ยนแปลงวิธีการคำนวณ GDP) อาจส่งผลต่อความสามารถในการเปรียบเทียบแบบปีต่อปี
- ประเทศเล็กๆ ดินแดน และประเทศเอกราชใหม่มักมีข้อมูลที่ไม่สมบูรณ์หรือขาดหายไป
- อันดับจะสะท้อนเฉพาะประเทศที่รายงานข้อมูลสำหรับช่วงเวลาที่กำหนด — การไม่อยู่ในการจัดอันดับไม่ได้หมายความว่ามีค่าเป็นศูนย์