การเปรียบเทียบประสิทธิภาพการจำแนกข้อมูลเพื่อทำนายการได้รับทุนการศึกษาของนักศึกษาระดับปริญญาตรี โดยใช้เทคนิควิธีการทำเหมืองข้อมูล

ผู้แต่ง

  • พีรศุษม์ ทองพ่วง กองบริหารงานบพิตรพิมุขจักรวรรดิ มหาวิทยาลัยเทคโนโลยีราชมงคลรัตนโกสินทร์
  • จรัญ แสนราช ภาควิชาคอมพิวเตอร์ศึกษา คณะครุศาสตร์อุตสาหกรรม มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ

คำสำคัญ:

ทุนการศึกษา, ต้นไม้ตัดสินใจ, เบย์, เคเนียร์เรสเนเบอร์, เรียนรู้เชิงลึก, แรนดอมฟอร์เรส

บทคัดย่อ

การวิจัยครั้งนี้มีวัตถุประสงค์เพื่อวิเคราะห์ปัจจัยที่เกี่ยวข้องในการได้รับทุนการศึกษาของนักศึกษาระดับปริญญาตรีและเพื่อเปรียบเทียบประสิทธิภาพการจำแนกข้อมูลของตัวแบบด้วยเทคนิควิธีต้นไม้ตัดสินใจ(Decision Tree) วิธีแบบเบย์(Naïve Bayes) วิธีเคเนียร์เรสเนเบอร์(K-Nearest Neighbors) วิธีการเรียนรู้เชิงลึก(Deep Learning) และวิธีแรนดอมฟอร์เรส(Random Forest) โดยใช้ข้อมูลจากการขอทุนการศึกษาของนักศึกษาระดับปริญญาตรีคณะบริหารธุรกิจและคณะศิลปศาสตร์จากกองบริหารงานบพิตรพิมุขจักรวรรดิ มหาวิทยาลัยเทคโนโลยีราชมงคลรัตนโกสินทร์พื้นที่บพิตรพิมุขจักรวรรดิ ระหว่างปีการศึกษา 2557-2561 มีจำนวน 15 แอตทริบิวต์  และข้อมูลจำนวน 1,155 ชุด การวิเคราะห์ข้อมูลใช้โปรแกรม Rapid Miner 9.3 ในการวิเคราะห์ปัจจัยที่เกี่ยวข้องและทดสอบประสิทธิภาพด้วยวิธี 10-Fold Cross Validation กับตัวแบบ ผลการวิจัยพบว่าข้อมูลที่มีความเกี่ยวข้องกันมีจำนวน 11 แอตทริบิวต์ และการจำแนกประเภทที่มีค่าความถูกต้องสูงสุดโดยวิธีแรนดอมฟอร์เรส(Random Forest)มีค่าร้อยละ 94.28 รองลงมาคือวิธีการเรียนรู้เชิงลึก(Deep Learning) มีค่าความถูกต้องร้อยละ 93.51 วิธีต้นไม้ตัดสินใจ(Decision Tree) มีค่าความถูกต้องร้อยละ 92.64 วิธีแบบเบย์(Naïve Bayes) มีค่าความถูกต้องร้อยละ 92.47 และวิธีที่ถูกต้องน้อยที่สุดคือวิธีเคเนียร์เรสเนเบอร์(K-Nearest Neighbors) มีค่าความถูกต้องร้อยละ 89.70 ตามลำดับ งานวิจัยนี้สามารถนำไปใช้ทำนายเพื่อวิเคราะห์แนวทางในการเสนอแนะและพัฒนาระบบสารสนเทศเพื่อใช้ประกอบการพิจารณาในการให้ทุนการศึกษาแก่นักศึกษาต่อไป

เอกสารอ้างอิง

กองทุนเพื่อความเสมอภาคทางการศึกษา. รายงานประจำปี 2562. กรุงเทพฯ: กสศ.; 2563.

พลเดช ปิ่นประทีป. กองทุนเพื่อความเสมอภาคทางการศึกษา (กสศ.) เป็นเครื่องมือใหม่ที่มีความสำคัญต่อการลดความเหลื่อมล้ำและขับเคลื่อนการปฏิรูปประเทศด้านการศึกษาในระยะยาว [อินเทอร์เน็ต]. [เข้าถึงเมื่อวันที่ 4 กุมภาพันธ์ 2564]. เข้าถึงได้จาก https://www. eef. or.th/103/

ภูมิศรันย์ ทองเลี่ยมนาค. สำรวจผลกระทบ COVID-19 จุดเปลี่ยนครั้งสำคัญของการศึกษาโลก [อินเทอร์เน็ต]. [เข้าถึงเมื่อวันที่ 4 กุมภาพันธ์ 2564]. เข้าถึงได้จาก https://www.eef. or.th/article1-02-01-211/

วิภา เจริญภัณฑารักษ์. คลังข้อมูล เหมืองข้อมูลและธุรกิจอัจฉริยะ หน่วยที่ 8. นนทบุรี: สำนักพิมพ์มหาวิทยาลัยสุโขทัยธรรมาธิราช; 2558.

วัจนา ขาวฟ้า และ อรศิริ ศิลาลัย. แบบจำลองการเลือกสายการเรียนที่เหมาะสมของนักศึกษาด้วยเทคนิคการจำแนก. การประชุมวิชาการระดับชาติและนานาชาติ มหาวิทยาลัยศรีปทุม ครั้งที่ 14 ประจำปี 2562; หน้า 1485-93.

อดุลย์ ยิ้มงาม. การทําเหมืองข้อมูล(Data Mining) [อินเทอร์เน็ต]. [เข้าถึงเมื่อวันที่ 5 กุมภาพันธ์ 2564]. เข้าถึงได้จาก http://com pcente.bu.ac.th/news-information/data-mining/

สายชล สินสมบูรณ์ทอง. การทำเหมืองข้อมูล เล่ม 1 การค้นหาความรู้จากข้อมูล. กรุงเทพฯ: จามจุรีโปรดักส์; 2560.

Nutdanai Wangpratham. DATA PREPARA- TION การเตรียมข้อมูล [อินเทอร์เน็ต]. [เข้าถึงเมื่อวันที่ 5 กุมภาพันธ์ 2564]. เข้าถึงได้จาก https://nutdnuy.medium.com/datapreparation-การเตรียมข้อมูล-81fba4e0b0c9

นงคราญ คำวิชัย. Practical Data Mining with RapidMiner Studio 7. เชียงใหม่: ITSCI; 2559.

Kasidis Satangmongkol. อธิบาย 10 Metrics พื้นฐานสำหรับวัดผลดโมเดล Machine Learning [อินเทอร์เน็ต]. [เข้าถึงเมื่อวันที่ 12 เมษายน 2564]. เข้าถึงได้จาก https://datarockie. com/2019/03/30/top-ten-machine-learning-metrics/

วิริยาภรณ์ พิชัยโชคและจันทร์จิรา พยัคฆ์เพศ. การประยุกต์ใช้กระบวนการลำดับชั้นเชิงวิเคราะห์เพื่อพิจารณาทุนการศึกษาของโรงเรียนหัวดงราชพรหมาภรณ์ จังหวัดนครสวรรค์. NU Science Journal 2013:9(2):29-46.

ปิยะนันท์ คงไพ่, จิรพันธุ์ ศรีสมพันธุ์ และจรัญ แสนราช. การวิเคราะห์รูปแบบความสนใจเลือกอาชีพของผู้เรียนการแบบทดสอบ ตามทฤษฎีของจอห์น ฮอลแลนด์ ด้วยเทคนิคเหมืองข้อมูล. Science and Technology RMUTT Journal 2019;9:80-90.

ดาวน์โหลด

เผยแพร่แล้ว

2021-11-09