VerbInd: Pangkalan data verba bahasa Indonesia berbasis korpus
Pengantar
VerbInd berlisensi Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Berikut adalah cara mengutip VerbInd ketika dirujuk dalam penelitian dan/atau pengajaran bahasa Indonesia:
Rajeg, G. P. W., & Denistia, K. (2023). VerbInd: Pangkalan data verba bahasa Indonesia berbasis korpus (Version 0.0.1) [Dataset]. https://gederajeg.github.io/database-verba-bahasa-indonesia/
VerbInd dibangun dari pangkalan data leksikal verba bahasa Indonesia berbasis korpus (Rajeg & Denistia 2023b). Pangkalan data tersebut melandasi bab buku berjudul Afiksasi Verba dalam Bahasa Indonesia (Rajeg & Denistia 2023a), yang akan terbit dalam bunga rampai sebagai bagian dari proyek penulisan buku Tatabahasa Bahasa Indonesia Kontemporer (TBIK) berbasis korpus (flyer seminar hasil dan rekaman seminar hasil).
Tabel data
VerbInd dihasilkan dari Korpus Bahasa Indonesia Kontemporer yang dikumpulkan oleh Pusat Pengembangan dan Pelindungan Bahasa dan Sastra, Badan Pengembangan dan Pembinaan Bahasa, Kementerian Pendidikan, Kebudayaan, Riset, dan Teknologi. VerbInd terdiri atas 9 kolom. Kolom year
menunjukkan informasi tahun sumber teks korpusnya, sedangkan genres
merupakan jenis ragam teks di dalam korpus. Kolom freq
menunjukkan berapa kali verba dalam kolom form
muncul di suatu ragam teks pada tahun tertentu. Kolom morph
adalah luaran analisis pemilahan struktur morfologis kata menggunakan MorphInd (Larasati, Kuboň & Zeman 2011), yang juga dipadukan dengan MALINDO Morph (Nomoto et al. 2018). Analisis morfologis tersebut telah dan terus akan diperbaiki secara manual jika terdapat kekeliruan. Kolom pref
(prefiks/awalan), root
(akar kata), root_POS
(kelas kata akar kata), dan suff
(sufiks/akhiran) diekstraksi dari komponen luaran MorphInd.