Alexandre Rademaker
Alexandre Rademaker
``` % cat documents/*.conllu | udapy -TM util.Mark node='(node.lemma in ["ter","ir","estar","vir"] and (not node.upos == "AUX") and node.next_node.upos == "VERB")' ``` em algumas correções do #265 , optei por algumas...
O comando abaixo retorna 45 casos de verbos seguidos de ter/estar/vir/ir: ``` % cat documents/*.conllu | udapy -q util.Eval node='if (node.lemma in ["ter","ir","estar","vir"] and (not node.upos == "AUX") and node.next_node.upos...
exemplos: ``` % cat documents/*.conllu | udapy -q util.Eval node='if node.form == "o" and node.prev_node.form == "por" and node.next_node.form == "menos": node.next_node.parent.draw(attributes="form,upos,feats,deprel")' # sent_id = CF114-7#19 # text = pelo...
primeiro número é o token, segundo é o HEAD, para onde o token aponta. ``` ─┮ │ ╭─┮ À NOUN obl 1 25 │ │ │ ╭─╼ medida ADP case...
temos alguns outros casos que merecem ser corrigidos: ``` % awk '$3 ~ /à|À/ {print FILENAME,$0}' documents/* documents/CF0072.conllu 1 À à NOUN N|M|S|@ADVL> Gender=Masc|Number=Sing 25 obl _ MWE=À_medida_que documents/CF0170.conllu 1...
@wellington36 observe que sempre que possível eu copio também o comando que usei para gerar a saída.
More cases of contractions missing MWT: 9 cases of "disso", "na" or "nas" tagged as PRON. related to UniversalDependencies/UD_Portuguese-GSD#14
Temos 5 casos de `disso`, todos parte da expressão `apesar disso` como em: ``` CF958-16> Apesar disso, a entrevista propiciou ao eleitor comum participar da vida política, o que é...
O único caso de `na` restante é ``` CF97-3> Para os menores, estão disponíveis o Pense Bem, o PC 1.000, o Telepapo e o Tá Na Hora ─┮ │ ╭─╼...
Os casos de `ao` que iniciaram este issue, são: ``` % cat *.conllu | udapy -q util.Eval node='if node.lemma == "ao": print(node.form, node.next_node.form,node.next_node.next_node.form,node.address())' Ao mesmo tempo CF145-4#1 Ao lado de...