Alexandre Rademaker
Alexandre Rademaker
Me ocorreu mais uma melhoria possível. Podemos usar freeling no texto original (ou no marcado removendo as marcações antes de chamar freeling) para comparar o resultado da ferramenta com a...
De @claudiafreitas : > Outra coisa: tem como na hora de alinhar a palavra com o synset, alinhar com o synset que fica imediatamente um nível acima?
@vcvpaiva acho que seus exemplos é o que no artigo (vide primeiro comentário) eles chamam de 'predicado complexo'. Vamos pesquisar os casos no corpus.
@claudiafreitas resultados parciais: https://raw.githubusercontent.com/own-pt/wordnet-editor/master/cstnews.org
Temos que contar os casos de predicados complexos como lembrando por @vcvpaiva ! Uma forma simplificada de melhorar nossa estatística seria apenas contar quantos predicados complexos ocorrem no corpus: ```...
seguindo sugestão @claudiafreitas , podemos tentar achar ancestral comum na hierarquia: ``` select ?ss { wn30en:synset-01120069-v wn30:hyponymOf* ?ss . wn30en:synset-01617192-v wn30:hyponymOf* ?ss . } ```
@claudiafreitas resultados atualizados https://raw.githubusercontent.com/own-pt/wordnet-editor/master/cstnews.org @vcvpaiva dados melhoram muito quando usamos a ultima OWN-PT com FreeLing. De 52% de mismatch entre Freeling e humanos passamos para 38%. Not bad. Agora precisamos...
@rafaelbetatester também podemos tentar saber da lista das sugestões, quais verbos não temos na OWN-PT ainda , em nenhum synset.
recall dos casos de -1 ``` > table(data$V1,data$V2) 0 1 2 3 4 5 6 7 8 9 10 11 -1 1413 370 139 55 31 14 1 0 2...
arquivos relacionados no commit own-pt/wordnet-editor@a48542e1