Alexandre Rademaker
Alexandre Rademaker
OK. Melhorei um pouco o script do comentário acima. Gerei dois arquivos, um que os dados dhbb de verbos são comparados por lemma com o morphobr, e outro onde são...
Correto, erros de lemmatização do UDPipe, por isso o `by-form`.
Acima vc disse `e a última entrada é a forma do singular de óculos na língua coloquial.` na verdade a primeira né?
Na forma atual do recurso, depois do issue #67 os exemplos que @leoalenc, na discussão de duplicidates, foram tratados e ficaram: ``` 5639 óculos óculo+N+M+PL 5640 óculo óculo+N+M+SG 5644 óculos...
Olá, Vou dar uma olhada. O arquivo referido deve estar desatualizado. Não existe um processo de compilação, mas imagino dois passos fundamentais: 1. Mapear as tags que usamos para as...
Claro agora, achei que a forma óculo era a que vc considerava coloquial.
@CrashAngelArts o comentário anterior ajudou? Considero esta tarefa não trivial, embora, como contribuir do Freeling, me interesse pelo problema. Vc estaria disposto em colaborar para termos uma tradução do MorphoBr...
Note ainda que no arquivo TAGSET já temos um mapeamento das tags [eagles](https://freeling-user-manual.readthedocs.io/en/v4.2/tagsets/) usadas pelo Freeing para PT ([link](https://freeling-user-manual.readthedocs.io/en/v4.2/tagsets/tagset-pt/)) para nossas tags.
@odanoburu não consegui reproduzir seus comandos no meu repo depois de pull.
@odanoburu editei agora seu comentário acima, também não tinha colocado a opção `-o`. Mas nestes arquivos ainda não estão os pares que podem vir do Freeling e Marcos certo?