Muthu Annamalai (முத்து அண்ணாமலை)
Muthu Annamalai (முத்து அண்ணாமலை)
Provide a tool like Linux command _banner_ for Tamil text It should take one or more sentences from command line, or a file(s) and generate a vertical banner on terminal...
We have several encodings available from open-tamil 'tamil.txt2unicode' module. These need to be registered with codecs module so they maybe used system wide after import tamil.txt2unicode directly from the codecs.open...
SciKitLearn classifier is present in the examples of OpenTamil to classify if given sequence of Tamil letters is English transliteration or original Tamil letters. e.g. காழ்ப்பு -vs- பக்கெட்
Collect Unigram data from Project Madurai, Wikipedia
OpenTamilWebApp demo - numeral generation audio [m/f] voice generation can be shown via the HTML tag and WAV synthesis module in Open-Tamil examples code. It would be a nice example...
Parallel corpora for Tamil. இது இருந்தால் "organic" என்ற சொல்லை "ஒர்கனிக்" என்று தமிழில் ஒலி மாற்றி எழுதினால், இதனை நாம் "இயற்கையான" என்று தமிழ்படுத்துவதற்கு உதவும்.
Continue work started by @arulalant to add reST docs for open-tamil classes and methods. Currently the following modules are exported to user as API via pip install. 1. tamil 2....
Auto lang mode needs a list of most common Tamil words https://github.com/emacsmirror/auto-lang
Remaining issues from ticket #18 Provide a standard method for Level II rendering for each complex character( avoid canonical equivalence problem)
தமிழில் வசை சொற்களின் பட்டியல் இது ஏன் தேவை என்றால் SPAM, PORNOGRAPhy போன்ற ஆபாச மூலங்களை தவிற்க நம்மால் filter "வடிகட்டிகளை" உருவாக்க முதல் படியாக அமையும்.