Alexandre Rademaker
Alexandre Rademaker
Então agora precisamos começar a consolidar os arquivos antes de gerar novas formas né ? Pode ser que muitas coisas venham de Freeling e Marcos
Muitos problemas são relacionados a: 1) tokens partes de MWE. No bosque original (revisão a partir de análises do PALAVRAS, expressões MWE eram juntadas em um único token (ex: `em...
related to https://github.com/UniversalDependencies/UD_Portuguese-Bosque/issues/219
Por favor, importante reportar aqui como vc gerou o relatório. Qual script vc rodou e como. Vc usou o esquema de unificação? Usou as features?
No relatório é importante ter a coluna POS e o ID do token também
Ah, então você não está usando o que tínhamos feito com a unificação de FST... Por isso os problemas com seu relatório...
Este issue trata de forma mais genérica o caso que acabei de fechar #57 . Lá o ultimo comentário do @leoalenc já chama atenção para a necessidade deste issue aqui...
Se entendi corretamente, as entradas para as formas `chei[ao]s?` agora são: ``` nouns/nouns-aa.dict 42470cheia cheia+N+F+SG 42471cheias cheia+N+F+PL 42478cheio cheio+N+M+SG 42479cheios cheio+N+M+PL adjectives/adjectives-aa.dict 48752cheia cheio+A+F+SG 48753cheias cheio+A+F+PL 48762cheio cheio+A+M+SG 48763cheios cheio+A+M+PL...
commit 6a0c91d não fecha este issue, apenas estou tentando validar meu entendimento para futuras ações.
For the compounds `N-ADJ` we can surely make a script to check, using the entries for nouns and adjectives. So `mosca-morta` is `mosca/N` and `morta/adj` so we can get the...