korektor icon indicating copy to clipboard operation
korektor copied to clipboard

Statistical spell- and (occasional) grammar-checker.

Results 14 korektor issues
Sort by recently updated
recently updated
newest added

Create browser plugins for Korektor service. Current plan is to have nearly same plugins for Firefox and Chrome. The plugin add context menu items which appear when clicking on `input`,...

Nalézat a nahrazovat chybně utvořené (falešné) vidové protějšky těmi správnými `zabrzďuje -> brzdí` - z Vallexu? - funguje na těch špatných morf. analýza dostatečně pro správnou náhradu?

enhancement
Czech

Start here: http://technet.idnes.cz/psani-angicky-0df-/sw_internet.aspx?c=A160125_131815_sw_internet_pka

evaluation
Czech

Pro slovo 'odpoved' obsahuje slovník z Korektoru následující položky: ``` odpoved|odpoved|NN--- odpověd|odpověd|NNMS- odpověd|odpověd|NN--- odpověd|odpověd|NNM-- odpověd|odpověd|NNMS1 ``` Formát je forma|lemma|tag. Po chvilce jsem našel ještě například ``` odpovedel|odpovedel|NNF-- odpovedet|odpovedet|NNIS1 odpovedel|odpovedel|NN--- odpovedel|odpovedel|NNI--...

bug
data

- Move training scripts to a new directory

enhancement

- That includes non-single-edit errors This will be useful for tuning the error model for different types of corpora

evaluation
data

Currently, we are using UCS-2 as internal encoding, which disallows us to use Unicode characters outside of BMP. We should change the internal representation, the current plans is to use...

If we sort out #10, that will leave us with the following complexity of language model lookups - 38.3/(100-47.6) = 73.1% ot time spend in language model lookup in `diacritics_h2mor.conf`...

Currently the similar word searching takes quite a lot of time. Considering `korektor-czech-130202` with `viterbi_beam_size=15` and `viterbi_stage_pruning=2.5`, similar words searching takes: - 47.6% with `diacritics_h2mor.conf` (for comparison, LM lookup takes...