Alexandre Rademaker

Results 172 issues of Alexandre Rademaker

``` % cat documents/*.conllu | udapy -q util.Eval node='if node.deprel == "nsubj" and node.parent.upos == "ADJ" and (node.feats["Gender"] != node.parent.feats["Gender"] or node.feats["Number"] != node.parent.feats["Number"]) : node.parent.draw(attributes="form,upos,feats,deprel")' ``` suspeitos: ``` %...

``` cat documents/*.conllu | udapy -q util.Eval node='if node.deprel == "appos" and (node.feats["Gender"] != node.parent.feats["Gender"] or node.feats["Number"] != node.parent.feats["Number"]) : node.parent.draw(attributes="form,upos,feats,deprel")' ``` Casos suspeitos podem ser identificados com a consulta...

manual

``` CP458-6> Uma verdade subjectiva incorporada através de normas sociais e, inversa e complementarmente, práticas sociais que avaliam do grau de integração de cada um. ─┮ │ ╭─╼ Uma DET...

@leoalenc o que acha? cada como DET? > CF29-2 Cinco linhas paralelas, de mais de 400 km cada, foram descobertas por cientistas australianos no sul do país. ``` ─┮ │...

decidido

``` % cat documents/*.conllu | udapy -q util.Eval node='if (node.upos == "DET" and node.deprel == "det" and node.parent.upos == "NOUN" and (node.feats["Gender"] != node.parent.feats["Gender"] or node.feats["Number"] != node.parent.feats["Number"])): print(node)' |...

In #38 @livyreal said that some PART are not correctly tokenized/lemmatized. Let us try a different approach... The following pages define the PART POS tag (in general and for English)....

automatic
decidido
a implementar

De #353 @leoalenc disse: > Poder-se-ia sugerir que como constitui uma preposição nesse caso. No entanto, essa análise não se coaduna com o fato de que como não exige caso...

Fizemos um experimento comparando o dicionário [MorphoBr](https://github.com/LFG-PTBR/MorphoBr) com o Bosque. Relatório: [bosque-diff.txt](https://github.com/own-pt/UD_Portuguese-Bosque/files/1925227/bosque-diff.txt) 1) tokens partes de MWE. No bosque original (revisão a partir de análises do PALAVRAS, expressões MWE eram...

``` % awk '$0 ~ /^[0-9]/ && $8 ~ /case/ {print $4}' *.conllu | sort | uniq -c | sort -nr 32675 ADP 88 ADV

We need to remove duplications on tags and organize the tags and releases of the resource. We should follow the UD releases to simplify our control. But we can find...