open-tamil
open-tamil copied to clipboard
Open Source Tamil NLP Tools - தமிழ் இயற்கை மொழி பகுப்பாய்வு நிரல்தொகுப்பு
Use open datasets from 1) https://www.kaggle.com/disisbig/tamil-wikipedia-articles 2) https://www.kaggle.com/disisbig/tamil-news-dataset
Extract Solvanam word corpus from 2019 database dump. Wikipedia-விலும், tamilpulavar.org-இலும் 1கோடி சொற்கள் இருப்பதாக கேள்வி.
Transliteration scheme by Mugunth. Ref: https://help.keyman.com/keyboard/ekwunitamil/1.0/ekwunitamil Tamil Consonants | | Grantha Consonants -- | -- | -- Consonant | Vowel/Pulli | Combinant | Keystrokes | | Consonant | Vowel/Pulli |...
What about making a javascript library for the same purpose it would be cool if this would be able to be handled with the browser more easily to test out...
Implement a Adami Madurai scheme for open-tamil > The following transliteration scheme (Adami/Madurai) is used: > vowels: a, A/aa, i, I/ee, u, U/oo, e, E, ai, o, O, au/ow, q/ah...
MIT licensed code for tf/idf search exists and needs to be ported over and using tokenized strings for Tamil so to enable search techniques locally for application.
இது தகவல் தொழில்நுட்பம் அதில் உள்ள விட்டர்பி அல்கோரிதம் பயன்படுத்தி ஒரு சொல்திருத்தியை உருவாக்குவது என்பது இலக்கு
Update / 2021: Blog post and source https://bart.degoe.de/building-a-full-text-search-engine-150-lines-of-code/ allows making a search module index using bag-of-words and term-frequency/IDF approach. We can use that technique to build a code module based...
Sir,Kindly make a video for python programming using Open-Tamil library and share with us. I don't know how to use it.