Complex Nominals in Thai: A Framework for Universal Dependencies Annotation
Main Article Content
Abstract
This study aims to develop annotation guidelines for two pairs of complex nominals in Thai based on the Universal Dependencies (UD) framework. The first pair includes nominals with a noun-complement clause and nominals with a relative clause, the second pair includes nominals with a reduced relative clause and synthetic compound. Additionally, this study aims to evaluate the quality of the proposed annotation guidelines. The findings indicate that the nominals in the first pair can be distinguished by four criteria: the presence of a head nominal, the occurrence of “thîi-wâa” preceding a noun-complement clause, gap strategy and resumptive pronoun.The nominals in the second pair can be distinguished by two criteria: the productivity of structure and the restoration of finiteness. For dependency annotation based on the UD framework, this study proposes the compound relation for nominals with a noun-complement clause and synthetic compound, whereas the acl (adjectival clause) relation is proposed for nominals with a relative clause and nominals with a reduced relative clause. The evaluation of the proposed annotation guidelines quality yielded an inter-annotator agreement score of 0.92
Downloads
Article Details

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
References
กมลชนก หงษ์ทอง. (2561). หน่วยสร้างอนุประโยคขยายคำนามในภาษาไทย [วิทยาพนธ์ปริญญาดุษฎีบัณฑิต, จุฬาลงกรณ์มหาวิทยาลัย]. Chula Digital Collections. https://digital.car.chula.ac.th/chulaetd/
นัทธ์ชนัน เยาวพัฒน์. (2551). พัฒนาการของพหุหน้าที่ของคำว่า ซึ่ง ในภาษาไทย [วิทยาพนธ์ปริญญาดุษฎีบัณฑิต, จุฬาลงกรณ์มหาวิทยาลัย]. Chulalongkorn University Intellectual Repository. http://cuir.car.chula.ac.th/handle/123456789/16136
ปราณี กุลละวณิชย์. (2553). อนุประโยคขยายนาม : คุณานุประโยคและอนุประโยคเติมเต็มนาม. ใน อมรา ประสิทธิ์รัฐสินธุ์ (บรรณาธิการ), หน่วยสร้างที่มีข้อขัดแย้งในไวยากรณ์ไทย : หน่วยสร้างคุณานุประโยค หน่วยสร้างกริยาเรียง และหน่วยสร้างกรรมวาจก (พิมพ์ครั้งที่ 2, น. 7-65). โรงพิมพ์แห่งจุฬาลงกรณ์มหาวิทยาลัย.
วิโรจน์ อรุณมานะกุล และ ธารทอง แจ่มไพบูลย์. (2566). คู่มือการกำกับข้อมูล Thai Dependency Tree Bank ตามแนว Universal Dependencies v.2. ศูนย์วิจัยการประมวลผลภาษาและวัจนะ ภาควิชาภาษาศาสตร์ คณะอักษรศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย.
สิทธิธรรม อ่องวุฒิวัฒน์. (2551). “ที่” คำหลายหน้าที่ในภาษาไทยปัจจุบัน. วรรณวิทัศน์, 8, 160-184.
อลิษา อินจันทร์ และ กิ่งกาญจน์ เทพกาญจนา. (2558). คำนามประสมแบบเท่าเทียมในภาษาไทย. วารสารมนุษยศาสตร์วิชาการ, 22(1), 118-150.
Aroonmanakun, W. (2007). Thoughts on word and sentence segmentation in Thai. In A. Kawtrakul, M. Zock, & W. Phantachat (Eds.), Proceedings of the Seventh Symposium on Natural Language Processing (pp. 85-90). Kasetsart University.
Aroonmanakun, W. (2015). The use of context vectors in determining Thai compounds. Linguistic Research, 32(1), 1-20. https://doi.org/10.17250/khisli.32.1.201504.001
de Marneffe, M.-C., Manning, C. D., Nivre, J., & Zeman, D. (2021). Universal Dependencies. Computational linguistics, 47(2), 255-308. https://doi.org/10.1162/coli_a_00402
Giegerich, H. (2009). Compounding and lexicalism. In R. Lieber & P. Štekauer (Eds.), The Oxford Handbook of Compounding (pp. 199-200). Oxford University Press.
Jenks, P. (2011). The hidden structure of Thai noun phrases [Doctoral dissertation]. Harvard University.
Kawtrakul, A., Suktarachan, M., Varasai, P., & Chanlekha, H. (2002). A state of the art of Thai language resources and Thai language behavior analysis and modeling. In COLING-02: The 3rd Workshop on Asian Language Resources and International Standardization (pp. 1-8). Association for Computational Linguistics.
Klie, J.-C., Bugert, M., Boullosa, B., Eckart de Castilho, R., & Gurevych, I. (2018). The INCEpTION platform: Machine-assisted and knowledge-oriented interactive annotation. In D. Zhao (Ed.), International Conference on Computational Linguistics (pp. 5-9). Association for Computational Linguistics.
Kriengket, K., Kosawat, K., & Anchaleenukul, S. (2007). A computational linguistics study of compound nouns in Thai. In Proceedings of the Seventh International Symposium on Natural Language Processing (SNLP 2007) (pp. 31-36). Kasetsart University.
Lowe, J. J. (2019). The syntax and semantics of nonfinite forms. Annual Review of Linguistics, 5, 309-328. https://doi.org/10.1146/annurev-linguistics-011718-012545
McHugh, M. L. (2012). Interrater reliability: The kappa statistic. Biochemia Medica, 22(3), 276-282. https://doi.org/10.11613/BM.2012.031
Phatthiyaphaibun, W., Chaovavanich, K., Polpanumas, C., Suriyawongkul, A., Lowphansirikul, L., Chormai, P., Limkonchotiwat, P., Suntorntip, T., & Udomcharoenchaikit, C. (2023). PyThaiNLP: Thai natural language processing in Python. In L. Tan, D. Milajevs, G. Chauhan, J. Gwinnup, & E. Rippeth (Eds.), Proceedings of the 3rd Workshop for Natural Language Processing Open Source Software (NLP-OSS 2023) (pp. 25-36). Association for Computational Linguistics. https://doi.org/10.18653/v1/2023.nlposs-1.4
Saetia, C., Chalothorn, T., & Taerungruang, S. (2022). Enhancing Thai keyphrase extraction using syntactic relations: An adoption of Universal Dependencies framework. In Proceedings of International Joint Conference 2022: The 17th International Joint Symposium on Artificial Intelligence and Natural Language Processing (iSAI-NLP 2022), The 3rd International Conference on Artificial Intelligence and Internet of Things (AIoT 2022) (pp. 1-6). IEEE. https://doi.org/10.1109/iSAI-NLP56921.2022.9960284
Singnoi, U. (2000). Nominal constructions in Thai (Publication No. 9986760) [Doctoral dissertation, University of Oregon]. ProQuest Dissertations & Theses.
Sleeman, P. (2017). Participial relative clauses. In M. Aronoff (Ed.), Oxford Research Encyclopedia of Linguistics (pp. 1-30). Oxford University Press. https://doi.org/10.1093/acrefore/9780199384655.013.185
Yaowapat, N., & Prasithrathsint, A. (2008). A typology of relatives clause in mainland southeast asian languages. Mon-Khmer Studies, 38, 1-23.