open-tamil icon indicating copy to clipboard operation
open-tamil copied to clipboard

Open Source Tamil NLP Tools - தமிழ் இயற்கை மொழி பகுப்பாய்வு நிரல்தொகுப்பு

Results 83 open-tamil issues
Sort by recently updated
recently updated
newest added

சொலிதிருத்தி அகராதி என்பது தற்சமயம் 2-பைட் UTF-8 முறையில் தமிழ் சொற்களை Trie-இல் சேமித்து வருகிறது. இவற்றை GNU Aspell வழியில், TSCII-வழியில் 1-பைட் குறியீட்டில் சேகரித்தால் கணினி நினைவக அளவு சிக்கனமாகும். மேலும் தேடல் வேகமும் கூடும் வாய்ப்பு உண்டு.

enhancement

நார்விக் அல்கொரிதம் கொண்டு சொல்திருத்தி கட்டமைக்கப்பட்டதால் இருமொழிகளிலும் ஓரே ஆவணத்தில் இருந்தாலும் செயல்படலாம்.

enhancement

Learn about Braille for Tamil; provide tools to, 1. Generate Braille cells from Tamil Text 2. Recognize Braille Cells and convert to Tamil Text ==References== Documents gathered from ArXiV and...

Provide Tools to work with Colonge transliteration scheme as follows: (Ref: https://www.sanskrit-lexicon.uni-koeln.de/scans/MWScan/tamil/index.html) ``` Cologne Online Tamil Lexicon All main entries in the Madras Tamil Lexicon (TL) and Supplement (TLS), and...

enhancement

Another longterm key project will be to read and write the affix format of dictionary file for aspell, hunspell etc. Basically we need updated domain specific dictionary for Tamil usage....

Tamil letter extraction is available in Open-Tamil: tamil.utf8.get_letters, or tamil.tace16.get_letters; however we need a API method to extract syllables from Tamil word for homophone, TTS processing, spelling checker applications. This...

enhancement

SciKit Learn model built to identify Tamil -vs- non-Tamil word can be cross checked against following words: 1. கிராபை 2. அநீதி 3. ஐஷொடோ 4. கிரீஸை 5. கிளாஸி மற்றும் கீழ் உள்ள...

பரிசோதனை

உதாரணமாக இந்த பத்தியில் உள்ள பல பெயரெச்சங்களையும் அவற்றின் பகுதி-விகுதிகளையும் சரியாக தற்சமயம் கையாளவில்லை. "குழந்தைகளின் மன அழுத்தத்தை அதிகமாக்கும் காரணங்கள் பலப்பல. தங்களுக்கு ஏற்பட்ட மனஅழுத்தத்தை ஒவ்வொரு குழந்தையும் ஒவ்வொரு விதமாக வெளிப்படுத்துவார்கள். சில குழந்தைகள் முகத்தை தூக்கி வைத்துக்...

bug

https://en.wikipedia.org/wiki/WX_notation An implementation is also found at, https://github.com/irshadbhat/indic-wx-converter

enhancement

வணக்கம் உங்கள் summarize வசதி ஊடகத்துறையில் நிறைய வழிகளை திறக்க உள்ளது.இப்போது கொடுக்கும் சொற்களை கொஞ்சம் கூட்ட முடியுமா?

enhancement