Research

Menuju Pengelompokan Kategori Kata Bahasa Indonesia yang Terstandarisasi dan Lebih Akurat

2 Jan 2021

Abstrak

Pekerjaan sebelumnya dalam penandaan bagian dari pidato (POS) bahasa Indonesia sulit untuk dibandingkan karena tidak dievaluasi pada dataset yang sama. Selain itu, meskipun peluang keberhasilan model jaringan saraf untuk penandaan POS bahasa Inggris, itu jarang dieksplorasi untuk bahasa Indonesia. Dalam makalah ini, kami mengeksplorasi berbagai teknik untuk penandaan POS bahasa Indonesia, termasuk model berbasis aturan, CRF, dan berbasis jaringan saraf. Kami mengevaluasi model kami pada Korpus Berlabel IDN. Sebuah pencapaian baru yang mutakhir dengan skor F1 97,47 dicapai dengan jaringan saraf berulang. Untuk memberikan standar untuk pekerjaan di masa depan, kami merilis pembagian dataset yang kami gunakan secara publik.

Unduh Abstrak Lengkap di sini

South Quarter Building, Tower C, level 10
Jl. R.A Kartini Kav 8, South Jakarta, 12430
(+62)21 50982692 | business@kata.ai

© 2025 Kata.ai | Hak Cipta Dilindungi Undang-Undang.

South Quarter Building, Tower C, level 10
Jl. R.A Kartini Kav 8, South Jakarta, 12430
(+62)21 50982692 | business@kata.ai

© 2025 Kata.ai | Hak Cipta Dilindungi Undang-Undang.

Industri

Produk

Perusahaan

Solusi

South Quarter Building, Tower C, level 10
Jl. R.A Kartini Kav 8, South Jakarta, 12430
(+62)21 50982692 | business@kata.ai

© 2025 Kata.ai | Hak Cipta Dilindungi Undang-Undang.