Muthu Annamalai (முத்து அண்ணாமலை)
Muthu Annamalai (முத்து அண்ணாமலை)
22-அக்டோபர் பேசிய "அடுத்த கட்ட தமிழ் கணிமை கூட்டு ஆலோசனைகள் சந்திப்பு" கூட்டத்தில் இணையதளம் ஒன்றில் ஓபன்-தமிழ் செயலிகளை இணையம் மூலம் பயன் செய்வதற்கு வசதிகள் அமைக்கவேண்டும் என்ற கோரிக்கை முன்வைக்கப்பட்டது. முக்கியமாக: 1. encoding குறி மாற்றி 2. சொல்திருத்தி...
JSON data format for Project Madurai TOC
Have this code check buffers via emacs. Ref:https://www.emacswiki.org/emacs/CategorySpelling
சொல்திருத்தி - specialized - dictionaries 1. science - physics, chemistry, biology 2. computers 3. Internet 4. law 5. medicine 6. people/personalities 7. places/capitals 8. acronyms
சொல்திருத்தி numerals can generate test cases where they are not spelling error sources
Split word into simple letters; this includes usual 'utf8.get_letters' and further splutting uyir-mei letters in uyir and mei portions. This would be useful in pattern matching for Santhi rules detection,...
பரிசோதனை நிரல் - open-tamil/tests/solthiruthi_suffixremoval.py பார்க்க : http://letsgrammar.org/declension.php
Drive Norving algorithm to find alternatives in mayangoli sorkal Ref: http://www.valaitamil.com/list-of-mayankoli-sorkal_15177.html
Corpus - given a corpora generate uni, bi-gram data This data can be used in tasks like prediction of words, and correction of spelling etc. The analysis task is captured...
Corpus - build n-gram predictor using a language model Get data from task #97 to build Bayesian filters, and n-gram predictors.