PySastrawi
PySastrawi copied to clipboard
add ability to manipulate stopwords
merujuk pada issue #9, saya menambahkan 2 method untuk memanipulasi stopwords pada StopWordRemoverFactory
method pertama
menambahkan stopword baru ke default stopword
>>> text = 'Aku pernah mendengar Aisya bercerita bahwa sebenarnya ia tidak terlalu senang dengan kabar perjodohan yang diatur oleh orang tuanya.'
>>> factory = StopWordRemoverFactory()
>>> new_stopwords = ['dengan', 'ia', 'bahwa', 'oleh']
>>> factory.append_stop_words(new_stopwords)
>>> remover = factory.create_stop_word_remover()
>>> print(remover.remove(text))
method kedua
membuat instance factory langsung dengan me-load file.
>>> text = 'Aku pernah mendengar Aisya bercerita bahwa sebenarnya ia tidak terlalu senang dengan kabar perjodohan yang diatur oleh orang tuanya.'
>>> factory = StopWordRemoverFactory.from_file('/path/to/stopwords.csv', delimiter=",", replace=True)
>>> remover = factory.create_stop_word_remover()
>>> print(remover.remove(text))
please review :)
Coverage decreased (-1.06%) to 96.317% when pulling 0e40516fbeacf5add6dafc338e664ed530dcbb1a on redite:feature/manipulate_stopwords into 0ab8ce2a994679af63880f3bdd1bb23570ffc010 on har07:master.
Coverage decreased (-1.06%) to 96.317% when pulling 0e40516fbeacf5add6dafc338e664ed530dcbb1a on redite:feature/manipulate_stopwords into 0ab8ce2a994679af63880f3bdd1bb23570ffc010 on har07:master.
Coverage decreased (-1.06%) to 96.317% when pulling 0e40516fbeacf5add6dafc338e664ed530dcbb1a on redite:feature/manipulate_stopwords into 0ab8ce2a994679af63880f3bdd1bb23570ffc010 on har07:master.
Selamat malam mas, mau tanya bagaimana kalau mau mengurangi kata dari list stopwordnya? Terimakasih.