Alexandre Rademaker

Results 489 comments of Alexandre Rademaker
trafficstars

Em 61c1043 resolvi os casos particulares listados acima. Desculpe, mas não ficou claro para mim @leoalenc a estratégia sugerida. Para `abacate` faltava uma forma, mas agora temos nos adjectivos derivados...

E como sua sugestão aqui se contrasta com https://github.com/LR-POR/MorphoBr/issues/90#issuecomment-853537826 ?

> @leoalenc: Talvez esse implique num grande trabalho manual para considerar cada caso individualmente. O interessante é que, no caso das vogais, i é palavra... por exemplo ... Não sei...

no caso específico de catalão, o google corrigi para `catalães` uma busca por `catalãos`. Eu votaria agora por remover as formas que nem PLP nem Houaiss listam mantendo apenas a...

Obrigado, o caso de `pessoas.../NOUN` também erro de tokenização, vou tratar lá no PUD.

@leoalenc este issue foi fechado com o PR #73 ? No PR vc menciona que o script teria que ser rodado nos dados, avise se for o caso e como...

@analununes podemos usar este issue para documentar o processo de 'compactação' que estamos propondo e concluir esta task com uma release do recurso.

O compile-dict.sh no root está desatualizado e apaguei (veja 2a428df). Na verdade, poderíamos talvez considerar uma distribuição como binário usando https://github.com/mhulden/foma/issues/130

See 8613d96 and the issue #130 mentioned above. We have a new `compile.sh` script in the root folder. It can compile the whole resource into a 1.2 MB binary file...

Bem, não temos `zerar` e `freqüentar` no MorphoBr, isto é fato. O que Lucas fez foi rodar https://github.com/cpdoc/dhbb-nlp/blob/master/udp/not_in_morpho.sh e obter esta lista https://github.com/cpdoc/dhbb-nlp/blob/master/udp/verbs.not_in_morpho! Mas UDPipe comete errors como ``` #...