korektor
korektor copied to clipboard
Statistical spell- and (occasional) grammar-checker.
Create browser plugins for Korektor service. Current plan is to have nearly same plugins for Firefox and Chrome. The plugin add context menu items which appear when clicking on `input`,...
Nalézat a nahrazovat chybně utvořené (falešné) vidové protějšky těmi správnými `zabrzďuje -> brzdí` - z Vallexu? - funguje na těch špatných morf. analýza dostatečně pro správnou náhradu?
Start here: http://technet.idnes.cz/psani-angicky-0df-/sw_internet.aspx?c=A160125_131815_sw_internet_pka
Pro slovo 'odpoved' obsahuje slovník z Korektoru následující položky: ``` odpoved|odpoved|NN--- odpověd|odpověd|NNMS- odpověd|odpověd|NN--- odpověd|odpověd|NNM-- odpověd|odpověd|NNMS1 ``` Formát je forma|lemma|tag. Po chvilce jsem našel ještě například ``` odpovedel|odpovedel|NNF-- odpovedet|odpovedet|NNIS1 odpovedel|odpovedel|NN--- odpovedel|odpovedel|NNI--...
- That includes non-single-edit errors This will be useful for tuning the error model for different types of corpora
Currently, we are using UCS-2 as internal encoding, which disallows us to use Unicode characters outside of BMP. We should change the internal representation, the current plans is to use...
If we sort out #10, that will leave us with the following complexity of language model lookups - 38.3/(100-47.6) = 73.1% ot time spend in language model lookup in `diacritics_h2mor.conf`...
Currently the similar word searching takes quite a lot of time. Considering `korektor-czech-130202` with `viterbi_beam_size=15` and `viterbi_stage_pruning=2.5`, similar words searching takes: - 47.6% with `diacritics_h2mor.conf` (for comparison, LM lookup takes...