Alexandre Rademaker
Alexandre Rademaker
@leoalenc estou tentando entender sua lista acima de molduras suspeitas. A estrutura de dados que temos me parece confusa, mas consegui da moldura chegar em um exemplo: ``` >>> val['']...
usando dicionários de valencias: ``` >>> from valences import * >>> import joblib >>> val = joblib.load('bosque-master-20211210.pickle') >>> val[''] [ameaçar, dizer, informar, poder, ver, continuar, afirmar, ser, achar, conseguir, ...]...
@leoalenc qual foi exatatmente seu código para obter o arquivo anexado?
Em 8416d722a, acredito ter resolvido a analise desta sentença. @leoalenc pode conferir? Me parece que a parte mais complicada é a construção: > ...os programas que estamos a transmitir... Mantive...
@leoalenc queira confirmar se entendi seu comentário acima, apenas confirmar se está correto para fecharmos este issue: > CP398-2 A peça «O repórter estava lá», publicada a 25 de Maio...
outros issues sobre apenas 1 sentença: #329 #309 #380
Correções foram feitas manualmente (editando arquivos) ou usando script? Neste último caso o script deve ser colocado no diretório scripts com nome issue-365.sh (ou .py) dependendo do que foi feito
qual seria o issue aqui? o problema mais grave é o tratamento inconsistente mas de fato, etc é et cetera vide https://pt.wikipedia.org/wiki/Et_cetera.
no English-EWT, eles não separam, mas tratam como pos `X` tendo a relação deprel conj ou list.. eu até gosto da idéia de separar mas teríamos que ver alguns casos...
se separarmos, o cetera não seria PRON, mas NOUN me parece.