Pembuatan Model Part of Speech Tagger Menggunakan Library Spacy untuk Bahasa Indonesia

HARRIS, FELIX GANI (2018) Pembuatan Model Part of Speech Tagger Menggunakan Library Spacy untuk Bahasa Indonesia. S1 thesis, UAJY.

[img] Text (FELIX GANI HARIS)
TF07768.pdf
Restricted to Repository staff only

Download (1MB)

Abstract

Bangsa Indonesia merupakan negara kepulauan dengan beragam suku yang mendiami pulau-pulau yang ada di Indonesia. Meski sebagian besar masyarakat Indonesia memahami Bahasa Indonesia namun tidak semua masyarakat menggunakan Bahasa Indonesia sebagai bahasa sehari-hari. Sebagian besar masyarakat Indonesia menggunakan bahasa daerahnya masing-masing dalam kehidupan sehari-hari. Hal ini membuat terjadinya banyak perdebatan mengenai penggunaan jenis-jenis kata dalam Bahasa Indonesia, seperti sulitnya membedakan antara jenis kata kerja dan kata sifat untuk suatu kata. Hingga saat ini masih kurang dokumentasi mengenai jenis-jenis kata dalam Bahasa Indonesia. Berdasarkan penelitian sebelumnya pengelompokan kata masih dilakukan dalam korpus dengan jumlah terbatas serta dilakukan dengan cara manual. Untuk melakukan pengelompokkan kata dibutuhkan seseorang yang benar-benar mengerti dan mendalami mengenai Bahasa Indonesia. Dari permasalahan tersebut penulis memanfaatkan library Spacy yang dapat digunakan pada bahasa pemrograman Python untuk membuat sebuah model bahasa yang dapat membantu dalam melakukan pelabelan kata atau POS tagger pada kalimat Bahasa Indonesia. Untuk membuat model bahasa menggunakan dua jenis korpus, yaitu korpus kalimat Bahasa Indonesia dan juga korpus tagger Bahasa Indonesia. Korpus kalimat Bahasa Indonesia menggunakan sumber situs berita Beritagar, dan universitas Leipzig yang berada di Jerman. Korpus tagger Bahasa Indonesia digunakan korpus yang berasal dari Universitas Indonesia dan juga lembaga PAN10. Dengan menggunakan korpus yang ada akan dihasilkan 4 buah model, yaitu model Beritagar_UI, Beritagar_PAN10, Leipzig_UI, dan Leipzig_PAN10. Dari model yang sudah berhasil dibuat diterapkan pada web service agar dapat digunakan pada berbagai platform yang berbeda dengan memanfaatkan format JSon yang dapat dipahami oleh berbagai bahasa pemrograman. Untuk tugas akhir ini penulis menggunakan plugin Flask dalam membangun web service yang akan digunakan dan menggunakan platform Android untuk mengakses model melalui web service.

Item Type: Thesis (S1)
Uncontrolled Keywords: Bahasa Indonesia, Part of Speech Tagger, Pengelompokan kata dalam Bahasa Indonesia
Subjects: Teknik Informatika > Mobile Computing
Divisions: Fakultas Teknologi Industri > Teknik Industri
Depositing User: Editor UAJY
Date Deposited: 07 Sep 2018 12:32
Last Modified: 07 Sep 2018 12:32
URI: http://e-journal.uajy.ac.id/id/eprint/15819

Actions (login required)

View Item View Item