Alexandre Rademaker
Alexandre Rademaker
Vide simples sumarização, parece que temos bastante coisa inconsistente. Imagino que lema e features para estes casos não varia com contexto: ``` $ cat *.conll | awk '$4 ~ /PRON/...
Correto, no corpus CP, os números são as linhas ``` # cat bosque_CP.udep.conll | gawk '$2 ~ /^lhe$/ && $3 ~ /\// { print NR, $2,$3 }' 9784 lhe ele/ela...
Eu discuti um pouco sobre isso com @claudiafreitas e acabamos não concluíndo nada. A discussão na lista UD também não evolui como eu esperava, com mais comentários de outras linguas....
for the records. In Freeling, Padro said they follow for Spanish and Catalan 1) personal pronouns: 1a) Nominative pronouns (yo, tú, él, ella, nosotros, nosotras, vosotros, vosotras, ellos, ellas) Are...
``` awk '$4 ~ /PRON/ {print $3}' *.conllu | sort | uniq -c ``` alguns casos que claramente não são pronomes.
Alguns pronomes clíticos têm mais de um valor para caso, acusativo ou dativo, e podem ser tanto OBL quanto OBJ. Mas como observado acima temos inconsistências de lematização. ``` %...
The remain cases to be fixed for `lhe` and `me`: ``` % awk '$2 ~ /^(me|lhe)$/ {print $2,$3,$8}' *.conllu | sort | uniq -c 20 lhe ela iobj 113 lhe...
Observe que recentemente fiz um commit com algumas poucas mudanças. Vc precisa atualizar sua versão antes de modificar e submeter PR.
Podem descrever, talvez no wiki, o que é este sistema http://comcorhd.tronco.me ? E como pretendem manter o dados dele atualizados com este repositório?
``` CL-CONLLU> (conllu.draw:tree-sentence (sentence-by-id "CF41-1" "documents/CF0041.conllu")) ─┮ │ ╭─╼ Zanini nsubj ╰─┾ diz root │ ╭─╼ que mark │ ├─╼ está aux ├─┾ preparando ccomp │ │ ╭─╼ a det...