Alexandre Rademaker
Alexandre Rademaker
``` awk '$2 ~ /^(maior|melhor|menor)$/ {print $2,$3,$4,$6}' *.conllu | sort | uniq -c 80 maior grande ADJ Gender=Fem|Number=Sing 46 maior grande ADJ Gender=Masc|Number=Sing 2 maior grande NOUN Gender=Fem|Number=Sing 1 maior...
Em https://github.com/UniversalDependencies/docs/issues/889, concordei em considerar que no PT temos os comparativos marcados por processos sintáticos apenas. Documentação em https://universaldependencies.org/pt/feat/Degree.html. Basicamente, só temos agora os valores Abs, Dim e Aug para...
assim como fiz em #410, generalizando a busca com a regex `.+a\t.+o\tNOUN`, encontrei vários outros casos. A maioria fácil de resolver, mas alguns mais delicados pendentes abaixo, muitos onde a...
@livyreal só perguntei. Acho estranho ter siglas em minúsculas como: `TV`, `PC` etc. Mas se funciona para vocês...
@livyreal seus argumentos não me convenceram. Acho que o case é sim importante e relevante feature para as ferramentas que estão aprendendo com os dados. Não fosse assim, poderiamos lematizar...
@claudiafreitas para o primeiro problema, uma regra simples do depedit realmente funcionou, mas só tivemos um caso! O complicado foi debugar: 1) o sistema não tem um modo de execução...
Todas as ocorrências de -se deveriam ser expl sobre sua interpretação ou temos mais de uma análise possíveis para considerar nos contextos?
Talvez relacionado com #211
> @arademaker e @wellington36 , o que essa página de documentação afirma não procede, vai de encontro ao que já está estabelecido na literatura e é reforçado pela documentação geral...
o commit 534b0cff5 corrigi um caso onde `situando-se` tinha o `se` marcado como obj e não expl. Mas este issue certamente irá necessitar de uma revisão sistemática. Temos que agora...