pythainlp
pythainlp copied to clipboard
Thai Natural Language Processing in Python.
## Detailed description We want to implement more Thai soundex to PyThaiNLP. ## Context _List thai soundex algorithm_ - [ ] [A Thai Soundex System for Spelling Correction (or KSS97)](https://linux.thai.net/~thep/soundex/soundex.html)...
Try this test set: ```python from pythainlp.transliterate import romanize test_cases = { None: "", "": "", "หมอก": "mok", "หาย": "hai", "แมว": "maeo", "เดือน": "duean", "ดำ": "dam", "ดู": "du", "บัว": "bua",...
Add test_nlpo3 test ### Your checklist for this pull request 🚨Please review the [guidelines for contributing](https://github.com/PyThaiNLP/pythainlp/blob/dev/CONTRIBUTING.md) to this repository. - [ ] Passed code styles and structures - [ ]...
PyThaiNLP wants you help us to improve the performance. You can fork this git, coding new code to improve the performance, and send your pull request to PyThaiNLP. These are...
Now, PyThaiNLP support only romanization by the Royal Thai General System of Transcription (RTGS) but we still doesn't support Thai-English/English-Thai transliteration. - [x] Add Wunsen to PyThaiNLP for Japanese-to-thai, Korean-to-thai,...
ปัจจุบันไฟล์ใน pythainlp/corpus มีรูปแบบการตั้งชื่อที่ไม่สม่ำเสมอ เสนอให้มีการใช้ชื่อที่สม่ำเสมอครับ เพื่อความสะดวกในการดูแลโค้ด (มีความคาดเดาได้บางอย่าง) ตัวอย่าง # การใช้ _ หรือ - คั่นคำ - thaipos.py
**Schedule** - First development release: 31 August 2022 - Beta release: 20 September 2022 - Production release: 24 September 2022 See [3.1 Milestone](https://github.com/PyThaiNLP/pythainlp/milestone/16). ## What is new? ### Deprecation and...
## Description When I tested with the easy sentence "Eat rice(กินข้าว)", all dictionary-based tokenizers such as longest and newmm gave wrong results. >  I think that "rice(ข้าว)" and "eat(กิน)"...
## Detailed description This feature will split Thai text to display cell. E.g. แม่น้ำอยู่ที่ไหน -> แ ม่ น้ํ า อ ยู่ ที่ ไ ห น. It will split Thai text...