ผลของการให้คะแนนที่มีต่อประสิทธิภาพการทดสอบแบบปรับเหมาะด้วยคอมพิวเตอร์

Main Article Content

ภาณุวัชร ปุรณะศิริ
สมศักดิ์ ลิลา
สมพงษ์ ปั้นหุ่น

บทคัดย่อ

การวิจัยนี้มีวัตถุประสงค์เพื่อศึกษาผลของการให้คะแนนที่มีต่อคุณภาพการวัดด้านความตรง ความเที่ยง ความคลาดเคลื่อนมาตรฐานในการวัด และเปรียบเทียบผลของการให้คะแนนที่มีต่อประสิทธิภาพการทดสอบแบบปรับเหมาะด้วยคอมพิวเตอร์ ในด้านจำนวนข้อสอบ และค่าฟังก์ชั่นสารสนเทศของชุดข้อสอบ เมื่อพิจารณาตามเกณฑ์การคัดเลือกข้อสอบ การประมาณค่าความสามารถผู้สอบ การยุติการทดสอบ และความสามารถของผู้สอบ โดยระยะแรกเป็นการสร้างคลังข้อสอบวิชาคณิตศาสตร์ ระดับชั้นมัธยมศึกษาตอนปลาย วิเคราะห์ตามทฤษฎีการตอบสนองข้อสอบ กลุ่มตัวอย่าง 3,330 คน ได้ข้อสอบ 230 ข้อ ยังไม่ได้ปรับสเกล การวัดนั้นมีลักษณะ ใกล้เคียงกัน ซึ่งสังเกตได้จากค่าเฉลี่ยของค่าพารามิเตอร์ของข้อสอบที่วิเคราะห์ได้ มีค่าอำนาจจำแนก 0.73-0.95  และค่าเบี่ยงเบนมาตรฐาน 0.06-0.24 อยู่ในเกณฑ์ดี มีค่าความยากง่าย 0.79-1.09 และค่าเบี่ยงเบนมาตรฐาน 0.29-1.27 อยู่ในเกณฑ์ค่อนข้างยาก มีค่าการเดา 0.11-0.16 และค่าเบี่ยงเบนมาตรฐาน 0.02-0.04 อยู่ในเกณฑ์ดี ทำการตรวจสอบความเป็นมิติเดียวโดยการวิเคราะห์องค์ประกอบ พบว่าค่าไอเกนตัวประกอบที่ 1 สูงกว่าค่าไอเกนตัวประกอบอื่นๆ ที่เหลือที่มีค่าไอเกนใกล้เคียงกัน แสดงว่า ข้อสอบที่ได้มีความเป็นมิติเดียว ระยะที่สองศึกษาผลของการให้คะแนนที่มีต่อประสิทธิภาพการทดสอบแบบปรับเหมาะด้วยคอมพิวเตอร์ วิเคราะห์ข้อมูลกลุ่มตัวอย่าง 540 คน โดยใช้ค่าเฉลี่ยเลขคณิต ค่าเบี่ยงเบนมาตรฐาน ผลการวิจัย พบว่า คุณภาพของการวัดจากผลของการให้คะแนนแบบ Multiple-Response Method (MR) แบบ Multiple True-False Method (MTF) และแบบ Omit Multiple True-False Method (OMTF) มีค่าความตรง คือ 0.7202, 0.7233, 0.7239 ตามลำดับ ค่าความเที่ยง คือ 0.7716, 0.7750, 0.7757 ตามลำดับ และความคลาดเคลื่อนมาตรฐานในการวัด คือ 0.2326, 0.4609, 0.2305 ตามลำดับ สำหรับผลของการให้คะแนนแบบ MR แบบ MTF และแบบ OMTF เมื่อพิจารณาตามเกณฑ์การคัดเลือกข้อสอบ การประมาณค่าความสามารถผู้สอบ การยุติการทดสอบ และความสามารถของผู้สอบ มีผลต่อจำนวนข้อสอบและค่าฟังก์ชั่นสารสนเทศของชุดข้อสอบ

Article Details

บท
บทความวิจัย
Author Biography

ภาณุวัชร ปุรณะศิริ

โรงเรียนบุรีรัมย์พิทยาคม

References

ชวาล แพรัตกุล. (2552). เทคนิคการวัดผล. (พิมพ์ครั้งที่ 7). กรุงเทพฯ: มหาวิทยาลัยศรีนครินทรวิโรฒ.
ต่าย เซี่ยงฉี. (2534). การศึกษาเปรียบเทียบประสิทธิภาพในการประมาณค่าความสามารถของผู้สอบจากการทดสอบเทเลอร์รูปปิรามิดที่มีรูปแบบจำนวนชั้นและวิธีการให้คะแนนที่ แตกต่างกันโดยใช้วิธีมอนติคาร์โล. ปริญญานิพนธ์การศึกษาดุษฎีบัณฑิต, สาขาวิชาการวิจัยและพัฒนาหลักสูตร บัณฑิตวิทยาลัย มหาวิทยาลัยศรีนครินทรวิโรฒ.
บุญชม ศรีสะอาด. (2540). การวิจัยทางการวัดผลและประเมินผล. กรุงเทพฯ: สุวีริยาสาส์น.
บุญชม ศรีสะอาด. (2553). การวิจัยเบื้องต้น (พิมพ์ครั้งที่ 8). กรุงเทพฯ: สุวิริยาสาส์น.
รังสรรค์ เล็กมณี. (2540). ผลของตัวแปรบางตัวต่อความเที่ยงตรงเชิงสภาพและจำนวนข้อสอบที่ใช้ในการทดสอบแบบปรับเหมาะกับความสามารถของผู้สอบด้วยคอมพิวเตอร์. วิทยานิพนธ์ดุษฎีบัณฑิต สาขาวิชาการทดสอบและวัดผลการศึกษา บัณฑิตวิทยาลัย มหาวิทยาลัยศรีนครินทรวิโรฒ.
ศิริชัย กาญจนวาสี. (2550). ทฤษฏีการทดสอบแนวใหม่ : MODERN TEST THEORY. กรุงเทพฯ: โรงพิมพ์แห่งจุฬาลงกรณ์มหาวิทยาลัย.
สมศักดิ์ ลิลา. (2539). การพัฒนาระบบคลังข้อสอบเพื่อการเรียนการสอนด้วยไมโครคอมพิวเตอร์. ปริญญานิพนธ์การศึกษาดุษฎีบัณฑิต สาขาวิชาการวิจัยและพัฒนาหลักสูตร บัณฑิตวิทยาลัย มหาวิทยาลัยศรีนครินทรวิโรฒ.
Coombs, C. H., Milholland, J. E., & Womer, F. B. (1956). The assessment of partial knowledge. Education and Psychological Measurement, 16, 13-37.
Frary, R. B. (1980). The effect of misinformation, partial information, and guessing on Expected multiple-choice test item scores. Applied Psychological Measurement, 4, 79-90.
Gifford, J. A., & Swaminathan, H. (1990). Bias and the Effect of Priors in Bayesian Estimation of Parameters of Item Response Model. Applied Psychological Measurement, 14(1), 33-43.
Haladyna, T. M., & Roid, G. H. (1983). Two Alternative Methods for Criterion-referenced Instructional Program Assessment. Educational Technology, 28, 35-38.
Hambleton, R. K., Swaminathan H., & Rogers, H. J. (1991). Fundamentals of Item Response Theory. London.
Ho, R. G. (1989). Using Micro CAT in Computerized Adaptive Testing: A Comparison of Three Adaptive Testing Strategies. Dissertation Abstracts International, 50(2), 421-A.
Leclercq, D. (1983). Confidence Marking : Its Use in Testing. Evaluation in Education, 6, 161-287.
Lord, F. M. (1980). Applications of Item Response Theory to Practical Testing Problems. Hillsdale, New Jersey: Lawrence Erlbaum Associates.
Lord, F. M., & Novick, M. R. (1968). Statistical Theories of Mental Test Scores. Reading Massachusetts: Addison-Welsley.
Urry, V. W. (1977). Tailored Testing: A Successful Application of Latent Trait Theory. Journal of Educational Measurement, 14(2), 181-196.