โครงงานนักศึกษา

การวิเคราะห์ปัจจัยที่ส่งผลต่อความล่าช้าของสายการบิน

analysis of factors affecting airline delays
เสร็จสมบูรณ์
ความก้าวหน้า
100%
ยื่นเสนอหัวข้อโครงการ
ผ่านการสอบข้อเสนอ
ลงทะเบียน
ผ่านการสอบความก้าวหน้า
สอบผ่าน final รอปรับแก้
6
เสร็จสมบูรณ์

บทคัดย่อ

โครงงานเรื่อง “การวิเคราะห์ปัจจัยที่ส่งผลต่อความล่าช้าของสายการบิน” (analysis of factors affecting airline delays) มีวัตถุประสงค์เพื่อศึกษาปัจจัยที่มีอิทธิพลต่อการเกิดความล่าช้าในการเดินทางทางอากาศ และพัฒนาแบบจำลองเพื่อพยากรณ์แนวโน้มของความล่าช้า โดยใช้เทคนิคเหมืองข้อมูล (data mining) และอัลกอริทึมการเรียนรู้ของเครื่อง (machine learning) เป็นเครื่องมือในการวิเคราะห์ข้อมูล ชุดข้อมูลที่ใช้คือ 2015 flight delays and cancellations dataset จากเว็บไซต์ kaggle ซึ่งประกอบด้วยข้อมูลเที่ยวบินภายในประเทศของสหรัฐอเมริกาจำนวนกว่า 5.8 ล้านระเบียน ข้อมูลถูกสุ่มด้วยวิธี stratified sampling 5% และผ่านกระบวนการเตรียมข้อมูลด้วยเทคนิค data cleaning เพื่อให้ได้ชุดข้อมูลที่เหมาะสมต่อการวิเคราะห์จำนวน 290,954 ระเบียน กระบวนการวิเคราะห์ใช้กรอบแนวทาง crisp–dm โดยแบ่งเป็นการทำความเข้าใจธุรกิจ การทำความเข้าใจข้อมูล การเตรียมข้อมูล การสร้างแบบจำลอง การประเมินผล และการนำเสนอผลลัพธ์ การสร้างแบบจำลองแบ่งออกเป็น 2 รูปแบบ ได้แก่ (1) การจำแนกประเภท (classification) โดยใช้เทคนิค decision tree และ random forest เพื่อจำแนกสถานะเที่ยวบินเป็น 3 กลุ่ม ได้แก่ on time, short delay และ delay และ (2) การถดถอยเชิงเส้นพหุคูณ (multiple linear regression: mlr) เพื่อพยากรณ์ค่าความล่าช้าเชิงตัวเลขในหน่วยนาที ผลการประเมินพบว่า โมเดล decision tree มีความแม่นยำ (accuracy) 90.01% และโมเดล random forest มีความแม่นยำ 89.30% ในขณะที่แบบจำลองถดถอยเชิงเส้นพหุคูณมีค่า r² = 0.873, rmse = 9.875 และ mae = 7.2 ซึ่งสะท้อนว่าโมเดลสามารถอธิบายความแปรปรวนของข้อมูลได้ถึงร้อยละ 87.3 ปัจจัยที่มีผลมากที่สุดต่อความล่าช้าคือ departure delay และ late aircraft delay จากนั้นได้พัฒนาเว็บไซต์ต้นแบบ airanalytica เพื่อแสดงผลการวิเคราะห์ในรูปแบบกราฟ แผนภูมิ และแดชบอร์ดแบบโต้ตอบ เพื่อให้ผู้ใช้งานสามารถเข้าถึงข้อมูลได้สะดวกและเข้าใจแนวโน้มของความล่าช้าได้ง่าย โดยสรุป การประยุกต์ใช้เทคนิคเหมืองข้อมูลและการเรียนรู้ของเครื่องร่วมกับการนำเสนอผ่านเว็บไซต์ ช่วยเพิ่มประสิทธิภาพในการวิเคราะห์และสื่อสารข้อมูลเชิงซับซ้อนให้เข้าใจง่าย สามารถต่อยอดสู่ระบบพยากรณ์ความล่าช้าแบบเรียลไทม์ สนับสนุนการตัดสินใจของสายการบิน และยกระดับประสิทธิภาพการบริหารจัดการในอุตสาหกรรมการบิน