Alexandre Rademaker
Alexandre Rademaker
Note-se que em #295 temos casos já desmembrados de `ao` e que introduzem cláusulas.
subárvores em https://gist.github.com/arademaker/af79556d4163ccbd165867a1f035f68d produzidas com ``` cat *.conllu | udapy -q util.Eval node='if node.lemma == "ao": node.parent.parent.draw()' ```
análises complicadas e possivelmente ainda erradas durante #215: 1. CP949-5 2. CP621-4 3. CP519-1
"de o que" (= than no inglês) 1. ADP, PRON, PRON CETENFolha n=926 cad=Cotidiano sec=soc sem=94b id: 3920 2. SCONJ, DET, PRON CETENFolha n=889 cad=Mundo sec=pol sem=94b id: 3749 3....
outros casos como `antes de X` e `além de`...
@claudiafreitas fez recente estudo sobre o assunto em http://www.periodicos.letras.ufmg.br/index.php/relin/article/view/17439. Interessante trabalho que podemos usar para identificação de inconsistências nos dados.
@claudiafreitas e @livyreal e qual seria a melhor alternativa? 'elas' imagino que deveria ser lematizado para 'eles' mas seria 'eles' lematizado para 'ele'? acho que a inflexão de verbos e...
@livyreal sim, mas e o caso de 'eles'? Eu concordei com o 'ela'!
@livyreal e @claudiafreitas precisamos de uma regra geral para lemas, curiosamente, em [1] ele não sugere nada para pronomes: > The POS tag also determines what word form will be...
@livyreal não, gostaria talvez de uma regra bem específica para cada POS. Acho que um artigo como o do Dan acima para português será um esforço interessante.