Yes/No Angoff Standard Setting on an English Proficiency Test: Setting Cut-Off Scores and Analyzing Standard Setting Validation
Main Article Content
Abstract
This research aimed to determine cut-off scores based on the CEFR framework levels A2, B1, and B2 using the Yes/No Angoff method for an English proficiency test developed by the English Department at Chiang Mai Rajabhat University, and to analyze the validation of the standard setting and the determined cut-off scores. There were ten judges in this study. The research instruments included an English proficiency test with a total score of 100, a CEFR standard comprehension test, a survey of judges’ opinions on the pre-standard setting training, the Yes/No Angoff evaluation form, and a survey of judges’ opinions on the standard setting process. The research findings indicated that the cut-off scores for the aforementioned English proficiency test, based on the CEFR framework, were set at 26 points for level A2, 64 points for level B1, and 84 points for level B2.The internal validation of the standard setting process and the assigned cut-off scores was verified through the Intraclass Correlation Coefficient (ICC) calculations, showing results of .92 for A2, .92 for B1, and .81 for B2.External validation, on the other hand, was examined using three methods: the first method involved focus group discussions on the reasonableness of the cut-off scores with representatives of curriculum administers and lecturers, the second method compared the grouping of test takers according to the CEFR levels by an experienced lecturer with the grouping based on the determined cut-off scores (Pearson correlation = .63), and the third method assessed the procedural validation by asking judges for their opinions on the standard setting process they participated in. It was found that the judges strongly agreed (mean = 3.78) with the overall standard setting process.
Article Details

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
ข้อความและบทความในวารสารการวัด ประเมินผล สถิติ และการวิจัยทางสังคมศาสตร์ เป็นแนวคิดของผู้เขียน มิใช่ความคิดเห็นของกองบรรณาธิการวารสาร จึงมิใช่ความรับผิดชอบของวารสารการวัด ประเมินผล สถิติ และการวิจัยทางสังคมศาสตร์ บทความในวารสารต้องไม่เคยตีพิมพ์ที่ใดมาก่อน และสงวนสิทธิ์ตามกฎหมายไทย การจะนำไปเผยแพร่ ต้องได้รับอนุญาตเป็นลายลักษณ์อักษรจากกองบรรณาธิการ
References
คณะกรรมการมาตรฐานการอุดมศึกษา, กระทรวงการอุดมศึกษา วิทยาศาสตร์ วิจัยและนวัตกรรม. (2567). ประกาศคณะกรรมการมาตรฐานการอุดมศึกษา เรื่อง นโยบายการยกระดับมาตรฐานภาษาอังกฤษในสถาบันอุดมศึกษา พ.ศ. 2567. https://www.ops.go.th/th/ches-downloads/edu-standard/item/9625-2567
สุพัฒน์ สุกมลสันต์. (2564). บทวิจารณ์เกี่ยวกับการวิจัยเพื่อกาหนดเกณฑ์ระดับความสามารถของแบบทดสอบด้วย Modified Angoff Method ตามเกณฑ์ของ CEFR และข้อเสนอแนะ: กรณีศึกษาบทความวิจัย 2 เรื่อง. วารสารภาษาปริทัศน์, 36, 73–92.
อนุวัติ คูณแก้ว. (2566). การทดสอบ การวัดผลและประเมินผล การศึกษาแนวใหม่. สำนักพิมพ์จุฬาลงกรณ์มหาวิทยาลัย.
Athiworakun, C., & Wudthayagorn, J. (2018). Mapping Srinakharinwirot University – standardized English test (SWU-SET) onto the Common European Framework of Reference (CEFR). Suranaree Journal of Social Science, 12(2), 69-84.
Cizek, G. J. (2012). An introduction to contemporary standard setting: Concepts, characteristics, and contexts. In G. J. Cizek (ed.), Setting performance standards: Foundations, methods, and innovations (pp. 3-14). Routledge.
Cizek, G. J., & Bunch, M. B. (2007). Standard setting: A guide to establishing and evaluating performance standard on tests. Sage Publications.
Council of Europe. (2009). Relating language examinations to the common European framework of reference for languages: Learning, teaching, assessment (CEFR). https://www.coe.int/en/web/common-european-framework-reference-languages/relating-examinations-to-the-cefr
Fowell, S. L., Fewtrell, R., & P. J. McLaughlin. (2008). Estimating the minimum number of judges required for test-centered standard setting on written assessments. Do discussion and iteration have an influence? Adv in Health Sci Edu, 13, 11-24.
Gliem, J. A., & Gliem, R. R. (2003). Calculating, interpreting, and reporting Cronbach’s Alpha reliability coefficient for Likert-type scales. Paper presented at Practice Conference in Adult, Continuing, and Community Education, Columbus.
Hughes, A. (2003). Testing for language teachers. Cambridge University Press.
Impara, J. C., & Plake, B. S. (1997). Standard setting: An alternative approach, Journal of Educational Measurement, 25(2), 353-366.
Koo, T. K., & Li, M. Y. (2016). A Guideline of selecting and reporting intraclass correlation coefficients for reliability research, Journal of Chiropractic Medicine, 15(2), 155–163.
Landis, J. R., & Koch, G. G. (1977). The measurement of observer agreement for categorical data. Biometrics, 33(1), 159-74.
Nakanitanon, P. (2021). Linking an English proficiency test to CEFR: Setting valid cut scores. The New English Teacher, 15(1), 53-64.
Plake, B., & Cizek, G. J. (2012). Variations on a theme: The modified Angoff, extended Angoff, and yes/no standard setting methods. In G. J. Cizek (ed.), Setting performance standards: Foundations, methods, and innovations (pp. 181-200). Routledge.
Tannenbaum, R. J., & Baron, P. A. (2015a). Mapping scores from the TOEFL Junior Comprehensive Test onto the Common European Framework of Reference (CEFR). Educational Testing Service.
Tannenbaum, R. J., & Baron, P. A. (2015b). Mapping TOEIC scores to the Vietnamese National Standard: A study to recommend English language requirements for admissions into and graduation from Vietnamese universities. Educational Testing Service.
Tiyawongsuwan, S., Lawthong, N., & Kanjanawasee, S. (2013). Standard setting for educational evaluation: Concepts, methods and applications. Kasetsart Journal of Social Sciences, 34(2), 225–240.
Todd, R. W. (2011). Analyzing and interpreting rating scale data from questionnaires. rEFLections, 14, 69–77.
Turner, R., & Carlson, L. A. (2003). Indexes of item-objective congruence for multidimensional items. International Journal of Testing, 3(2), 163-172.
Wudthayagorn, J. (2018). Mapping the CU-TEP to the common European framework of reference (CEFR). LEARN: Language Education and Acquisition Research Network Journal, 11(2), 163-180.
University of Michigan. (2014). Linking the Common European Framework of Reference and the MET writing test. https://michiganassessment.org