โครงงานนักศึกษา

การประยุกต์ใช้เทคนิคการวิเคราะห์การจัดกลุ่มเพื่อทำความเข้าใจความหลากหลายของ data scientist

applying clustering analysis techniques to understand the diversity of data scientists
เสร็จสมบูรณ์
ความก้าวหน้า
100%
ยื่นเสนอหัวข้อโครงการ
ผ่านการสอบข้อเสนอ
ลงทะเบียน
ผ่านการสอบความก้าวหน้า
สอบผ่าน final รอปรับแก้
6
เสร็จสมบูรณ์

บทคัดย่อ

โครงงานเรื่อง “การประยุกต์ใช้เทคนิคการวิเคราะห์การจัดกลุ่มเพื่อทำความเข้าใจความหลากหลายของ data scientist” มีวัตถุประสงค์เพื่อวิเคราะห์และจำแนกเงินเดือนของ data scientist โดยพิจารณาจากปัจจัยด้านประสบการณ์การทำงาน ตำแหน่งงาน ทักษะ ความเชี่ยวชาญเฉพาะด้าน และคุณลักษณะอื่น ๆ ที่เกี่ยวข้อง เพื่ออธิบายลักษณะเฉพาะของแต่ละกลุ่มที่ได้จากการจำแนก เช่น ระดับเงินเดือน ความสัมพันธ์กับประสบการณ์ และปัจจัยสำคัญที่ส่งผลต่อความแตกต่างของตลาดแรงงานสาย data scientist โครงงานนี้ใช้กระบวนการ crisp-dm ในการวิเคราะห์ข้อมูลตั้งแต่การทำความเข้าใจธุรกิจ การเตรียมข้อมูล การสร้างโมเดล และการประเมินผล โดยทำการทำความสะอาดและแปลงข้อมูลให้อยู่ในรูปแบบที่เหมาะสม เช่น การจัดกลุ่มเงินเดือน ตำแหน่งงาน และภูมิภาค จากนั้นสร้างโมเดลด้วย decision tree ผ่านโปรแกรม rapidminer พบว่า decision tree เป็นโมเดลที่เหมาะสมที่สุด เนื่องจากมี accuracy 89.17% สูงและอธิบายกฎการตัดสินใจได้ง่าย ผลลัพธ์สามารถจำแนกเงินเดือนได้เป็น medium, large, small พร้อมวิเคราะห์ความสัมพันธ์กับประสบการณ์และตำแหน่งงาน และนำเสนอผ่าน เว็บไซต์ ในรูปแบบกราฟและตารางเพื่อให้ผู้ใช้งานเข้าใจข้อมูลได้ง่าย