หน่วยนามซับซ้อนในภาษาไทย : การกำกับข้อมูลตามกรอบแนวคิด Universal Dependencies
Main Article Content
บทคัดย่อ
งานวิจัยเรื่องนี้มุ่งพัฒนาแนวทางการกำกับข้อมูลหน่วยนามซับซ้อนในภาษาไทยจำนวนสองคู่ตามแนว Universal Dependencies (UD) ได้แก่ คู่แรก คือ หน่วยนามที่ประกอบด้วยอนุพากย์เติมเต็มนามและหน่วยนามที่ประกอบด้วยคุณานุประโยค และคู่ที่สอง คือ หน่วยนามที่ประกอบด้วยคุณานุประโยคแบบลดรูปและหน่วยนามที่เป็นคำนามประสมแบบสังเคราะห์ อีกทั้งยังมุ่งทดสอบคุณภาพของแนวทางการกำกับข้อมูลที่พัฒนาขึ้น ผลการศึกษาพบว่า หน่วยนามคู่แรกมีเกณฑ์การจำแนกความแตกต่างสี่ประการ ได้แก่ เกณฑ์การทดสอบการปรากฏของหน่วยนามหลัก เกณฑ์การทดสอบการปรากฏ “ที่ว่า” นำหน้าอนุพากย์เติมเต็มนาม เกณฑ์การทดสอบกลวิธีช่องว่าง และเกณฑ์การทดสอบการใช้บุรุษสรรพนามซ้ำรอย ส่วนหน่วยนามคู่ที่สอง มีเกณฑ์การจำแนกความแตกต่างสองประการ ได้แก่ เกณฑ์การทดสอบผลิตภาวะของโครงสร้างและเกณฑ์การทดสอบการคืนความแท้ ในการกำกับข้อมูลภายในโครงสร้างตามแนว UD งานนี้ได้เสนอให้ใช้ความสัมพันธ์ compound สำหรับหน่วยนามที่ประกอบด้วยอนุพากย์เติมเต็มนามและหน่วยนามที่เป็นคำนามประสมแบบสังเคราะห์ ในขณะที่หน่วยนามที่ประกอบด้วยคุณานุประโยคและหน่วยนามที่ประกอบด้วยคุณานุประโยคแบบลดรูปให้ใช้ความสัมพันธ์ acl ส่วนการทดสอบคุณภาพของแนวทางการกำกับข้อมูลที่พัฒนาขึ้น ผลการทดสอบให้ค่าความสอดคล้องเท่ากับ 0.92
Downloads
Article Details

อนุญาตภายใต้เงื่อนไข Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
เอกสารอ้างอิง
กมลชนก หงษ์ทอง. (2561). หน่วยสร้างอนุประโยคขยายคำนามในภาษาไทย [วิทยาพนธ์ปริญญาดุษฎีบัณฑิต, จุฬาลงกรณ์มหาวิทยาลัย]. Chula Digital Collections. https://digital.car.chula.ac.th/chulaetd/
นัทธ์ชนัน เยาวพัฒน์. (2551). พัฒนาการของพหุหน้าที่ของคำว่า ซึ่ง ในภาษาไทย [วิทยาพนธ์ปริญญาดุษฎีบัณฑิต, จุฬาลงกรณ์มหาวิทยาลัย]. Chulalongkorn University Intellectual Repository. http://cuir.car.chula.ac.th/handle/123456789/16136
ปราณี กุลละวณิชย์. (2553). อนุประโยคขยายนาม : คุณานุประโยคและอนุประโยคเติมเต็มนาม. ใน อมรา ประสิทธิ์รัฐสินธุ์ (บรรณาธิการ), หน่วยสร้างที่มีข้อขัดแย้งในไวยากรณ์ไทย : หน่วยสร้างคุณานุประโยค หน่วยสร้างกริยาเรียง และหน่วยสร้างกรรมวาจก (พิมพ์ครั้งที่ 2, น. 7-65). โรงพิมพ์แห่งจุฬาลงกรณ์มหาวิทยาลัย.
วิโรจน์ อรุณมานะกุล และ ธารทอง แจ่มไพบูลย์. (2566). คู่มือการกำกับข้อมูล Thai Dependency Tree Bank ตามแนว Universal Dependencies v.2. ศูนย์วิจัยการประมวลผลภาษาและวัจนะ ภาควิชาภาษาศาสตร์ คณะอักษรศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย.
สิทธิธรรม อ่องวุฒิวัฒน์. (2551). “ที่” คำหลายหน้าที่ในภาษาไทยปัจจุบัน. วรรณวิทัศน์, 8, 160-184.
อลิษา อินจันทร์ และ กิ่งกาญจน์ เทพกาญจนา. (2558). คำนามประสมแบบเท่าเทียมในภาษาไทย. วารสารมนุษยศาสตร์วิชาการ, 22(1), 118-150.
Aroonmanakun, W. (2007). Thoughts on word and sentence segmentation in Thai. In A. Kawtrakul, M. Zock, & W. Phantachat (Eds.), Proceedings of the Seventh Symposium on Natural Language Processing (pp. 85-90). Kasetsart University.
Aroonmanakun, W. (2015). The use of context vectors in determining Thai compounds. Linguistic Research, 32(1), 1-20. https://doi.org/10.17250/khisli.32.1.201504.001
de Marneffe, M.-C., Manning, C. D., Nivre, J., & Zeman, D. (2021). Universal Dependencies. Computational linguistics, 47(2), 255-308. https://doi.org/10.1162/coli_a_00402
Giegerich, H. (2009). Compounding and lexicalism. In R. Lieber & P. Štekauer (Eds.), The Oxford Handbook of Compounding (pp. 199-200). Oxford University Press.
Jenks, P. (2011). The hidden structure of Thai noun phrases [Doctoral dissertation]. Harvard University.
Kawtrakul, A., Suktarachan, M., Varasai, P., & Chanlekha, H. (2002). A state of the art of Thai language resources and Thai language behavior analysis and modeling. In COLING-02: The 3rd Workshop on Asian Language Resources and International Standardization (pp. 1-8). Association for Computational Linguistics.
Klie, J.-C., Bugert, M., Boullosa, B., Eckart de Castilho, R., & Gurevych, I. (2018). The INCEpTION platform: Machine-assisted and knowledge-oriented interactive annotation. In D. Zhao (Ed.), International Conference on Computational Linguistics (pp. 5-9). Association for Computational Linguistics.
Kriengket, K., Kosawat, K., & Anchaleenukul, S. (2007). A computational linguistics study of compound nouns in Thai. In Proceedings of the Seventh International Symposium on Natural Language Processing (SNLP 2007) (pp. 31-36). Kasetsart University.
Lowe, J. J. (2019). The syntax and semantics of nonfinite forms. Annual Review of Linguistics, 5, 309-328. https://doi.org/10.1146/annurev-linguistics-011718-012545
McHugh, M. L. (2012). Interrater reliability: The kappa statistic. Biochemia Medica, 22(3), 276-282. https://doi.org/10.11613/BM.2012.031
Phatthiyaphaibun, W., Chaovavanich, K., Polpanumas, C., Suriyawongkul, A., Lowphansirikul, L., Chormai, P., Limkonchotiwat, P., Suntorntip, T., & Udomcharoenchaikit, C. (2023). PyThaiNLP: Thai natural language processing in Python. In L. Tan, D. Milajevs, G. Chauhan, J. Gwinnup, & E. Rippeth (Eds.), Proceedings of the 3rd Workshop for Natural Language Processing Open Source Software (NLP-OSS 2023) (pp. 25-36). Association for Computational Linguistics. https://doi.org/10.18653/v1/2023.nlposs-1.4
Saetia, C., Chalothorn, T., & Taerungruang, S. (2022). Enhancing Thai keyphrase extraction using syntactic relations: An adoption of Universal Dependencies framework. In Proceedings of International Joint Conference 2022: The 17th International Joint Symposium on Artificial Intelligence and Natural Language Processing (iSAI-NLP 2022), The 3rd International Conference on Artificial Intelligence and Internet of Things (AIoT 2022) (pp. 1-6). IEEE. https://doi.org/10.1109/iSAI-NLP56921.2022.9960284
Singnoi, U. (2000). Nominal constructions in Thai (Publication No. 9986760) [Doctoral dissertation, University of Oregon]. ProQuest Dissertations & Theses.
Sleeman, P. (2017). Participial relative clauses. In M. Aronoff (Ed.), Oxford Research Encyclopedia of Linguistics (pp. 1-30). Oxford University Press. https://doi.org/10.1093/acrefore/9780199384655.013.185
Yaowapat, N., & Prasithrathsint, A. (2008). A typology of relatives clause in mainland southeast asian languages. Mon-Khmer Studies, 38, 1-23.