Pembangunan Model Pembelajaran Mesin untuk Identifikasi Struktur Kalimat Bahasa Indonesia

Panigas, Radian Satria (2018) Pembangunan Model Pembelajaran Mesin untuk Identifikasi Struktur Kalimat Bahasa Indonesia. S1 thesis, UAJY.

[img]
Preview
Text (HALAMAN AWAL)
TF075810.pdf

Download (842kB) | Preview
[img]
Preview
Text (BAB I)
TF075811.pdf

Download (219kB) | Preview
[img]
Preview
Text (BAB II)
TF075812.pdf

Download (105kB) | Preview
[img]
Preview
Text (BAB III)
TF075813.pdf

Download (1MB) | Preview
[img] Text (BAB IV)
TF075814.pdf
Restricted to Registered users only

Download (979kB)
[img] Text (BAB V)
TF075815.pdf
Restricted to Registered users only

Download (238kB)
[img]
Preview
Text (BAB VI)
TF075816.pdf

Download (298kB) | Preview

Abstract

Penelitian dan penerapan Natural Language Processing dalam dunia teknologi semakin meningkat dan berkembang. Umumnya pengembangan NLP terjadi secara pesat dalam pemrosesan Bahasa Inggris. Metode – metode yang digunakan dalam proses training model NLP umumnya menggunakan algoritma Machine Learning. Salah satu penyebab berkembangnya NLP adalah meningkatnya jumlah data linguistik yang tersedia. Namun mayoritas sistem dan data yang tersedia saat ini adalah bagian dari high-resource language seperti Bahasa Inggris, Perancis, Jerman, Spanyol dan China. Dalam pembangunan model Machine Learning ini, model akan digunakan untuk mengidentifikasi struktur kalimat dalam Bahasa Indonesia. Model akan dirancang berdasarkan beberapa referensi model NLP yang dipakai untuk pemrosesan Bahasa Inggris. Pembuatan model akan dirancang dengan Bahasa pemrograman Python. Data yang digunakan dikumpulkan dari berbagai macam sumber seperti Kompas, Historia, dan Beritagar. Data dibagi menjadi 2538 data latih, 725 data validasi dan 364 data tes. Model terbaik yang dibuat memiliki skor F1 mencapai 81.57% pada data testing. Model dapat memprediksi struktur kalimat Bahasa Indonesia. Dari proses pengujian, dapat disimpulkan bahwa model mampu mengidentifikasi struktur kalimat Bahasa Indonesia dengan cukup baik.

Item Type: Thesis (S1)
Uncontrolled Keywords: Natural Language Processing, Machine Learning, Struktur Kalimat Bahasa Indonesia, Bahasa Indonesia.
Subjects: Teknik Informatika > Mobile Computing
Divisions: Fakultas Teknologi Industri > Teknik Informatika
Depositing User: Editor UAJY
Date Deposited: 12 Feb 2019 01:28
Last Modified: 12 Feb 2019 01:28
URI: http://e-journal.uajy.ac.id/id/eprint/16518

Actions (login required)

View Item View Item