VerbInd: Pangkalan data verba bahasa Indonesia berbasis korpus

Authors
Affiliations

University of Oxford

Universitas Udayana

Universitas Sebelas Maret

Published

May 18, 2023

Modified

May 30, 2023

Doi

Pengantar

Creative Commons License
VerbInd berlisensi Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.


Berikut adalah cara mengutip VerbInd ketika dirujuk dalam penelitian dan/atau pengajaran bahasa Indonesia:

Rajeg, G. P. W., & Denistia, K. (2023). VerbInd: Pangkalan data verba bahasa Indonesia berbasis korpus (Version 0.0.1) [Dataset]. https://gederajeg.github.io/database-verba-bahasa-indonesia/

VerbInd dibangun dari pangkalan data leksikal verba bahasa Indonesia berbasis korpus (Rajeg & Denistia 2023b). Pangkalan data tersebut melandasi bab buku berjudul Afiksasi Verba dalam Bahasa Indonesia (Rajeg & Denistia 2023a), yang akan terbit dalam bunga rampai sebagai bagian dari proyek penulisan buku Tatabahasa Bahasa Indonesia Kontemporer (TBIK) berbasis korpus (flyer seminar hasil dan rekaman seminar hasil).

Tabel data

VerbInd dihasilkan dari Korpus Bahasa Indonesia Kontemporer yang dikumpulkan oleh Pusat Pengembangan dan Pelindungan Bahasa dan Sastra, Badan Pengembangan dan Pembinaan Bahasa, Kementerian Pendidikan, Kebudayaan, Riset, dan Teknologi. VerbInd terdiri atas 9 kolom. Kolom year menunjukkan informasi tahun sumber teks korpusnya, sedangkan genres merupakan jenis ragam teks di dalam korpus. Kolom freq menunjukkan berapa kali verba dalam kolom form muncul di suatu ragam teks pada tahun tertentu. Kolom morph adalah luaran analisis pemilahan struktur morfologis kata menggunakan MorphInd (Larasati, Kuboň & Zeman 2011), yang juga dipadukan dengan MALINDO Morph (Nomoto et al. 2018). Analisis morfologis tersebut telah dan terus akan diperbaiki secara manual jika terdapat kekeliruan. Kolom pref (prefiks/awalan), root (akar kata), root_POS (kelas kata akar kata), dan suff (sufiks/akhiran) diekstraksi dari komponen luaran MorphInd.

Frekuensi verba bahasa Indonesia menurut ragam teks dan tahun

Tabel berikut menampilkan gabungan frekuensi tiap-tiap bentuk kata (form) dari keseluruhan ragam teks dan tahun.

Frekuensi verba bahasa Indonesia keseluruhan

Daftar pustaka

Larasati, Septina Dian, Vladislav Kuboň & Daniel Zeman. 2011. International Workshop on Systems and Frameworks for Computational Morphology. In, 119–129. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-23138-4_8.
Nomoto, Hiroki, Hannah Choi, David Moeljadi & Francis Bond. 2018. MALINDO morph: Morphological dictionary and analyser for malay/indonesian. In, 36–43. http://lrec-conf.org/workshops/lrec2018/W29/pdf/8_W29.pdf.
Rajeg, Gede Primahadi Wijaya & Karlina Denistia. 2023a. Afiksasi Verba dalam Bahasa Indonesia. https://doi.org/10.6084/m9.figshare.22336729.v1.
Rajeg, Gede Primahadi Wijaya & Karlina Denistia. 2023b. Material pendukung untuk Afiksasi Verba dalam Bahasa Indonesia. Zenodo. https://doi.org/10.5281/zenodo.7812619.

Citation

For attribution, please cite this work as:
Rajeg, Gede Primahadi Wijaya & Karlina Denistia. 2023. VerbInd: Pangkalan data verba bahasa Indonesia berbasis korpus. Zenodo. https://doi.org/10.5281/zenodo.7947605.