PySastrawi icon indicating copy to clipboard operation
PySastrawi copied to clipboard

Indonesian stemmer. Python port of PHP Sastrawi project.

Results 12 PySastrawi issues
Sort by recently updated
recently updated
newest added

ketika saya masukan kata dibelinya -> bel ketika saya dikurangi -> rang

Stemmer "pengering", jadi "ering", yang seharusnya "kering"

merujuk pada issue #9, saya menambahkan 2 method untuk memanipulasi stopwords pada `StopWordRemoverFactory` ### method pertama menambahkan stopword baru ke default stopword ``` >>> text = 'Aku pernah mendengar Aisya...

1. Menurut saya stopword custom sangat memungkinkan dalam pemrosesan text, jadi diperlukan untuk penambahan opsi jika user yang menggunakan library ini dapat menggunakan file stopword sendiri 2. Kemudian, menurut saya...

menambahkan stopword: - maaf - memaafi - memaafkan - mengakankan

1. Boost Performance Hal ini dapat dicapai dengan menggunakan lru_cache (untuk cache dictionary kata dasar dan stopword). 2. Menambahkan fitur stem dari tokens (word list) dan fitur stopword removal dari...

1. Menambahkan Stopword Tala 2003 pada StopwordRemoverFactory (Tala, Fadillah Z. 2003. A Study of Stemming Effects on Information Retrieval in Bahasa Indonesia. Universiteit van Amsterdam) 2. Menambahkan Lru Cache pada...

Untuk melakukan stemming 87000 paragraf di i7, membutuhkan waktu ~ 24 jam. Kecepatannya sekitar 500-1000 ms per paragraf. Sepertinya ada potensi untuk optimisasi, tapi saya sendiri belum tahu. :D

enhancement

kata relawan jadi rawan, yg seharusnya tetap jadi kata relawan dalam kasus ini, saya mencoba untuk menstem banyak text dari csv ke csv utk mengetahui perbedaannya seberapa banyak ``` with...

Untuk metode pencarian di kamusnya pada fungsi yang mana ya? karena saya berencana melakukan improve dibagian tersebut. Terimakasih.