openWordnet-PT
openWordnet-PT copied to clipboard
casos reflexivos, -se, separar ou não
@claudiafreitas disse:
eu tinha feito uma proposta ao Alexandre, para algum aluno dele, com relação ao -se.
Isto porque não acho que devemos fazer os verbos -se na mão, segundo o nosso achismo. O fato de não termos nada muito razoável em portugues não significa que isso nao possa ser feito direito.
Minha proposta é usar a abordagem da tese em anexo, capit. 5/seção 5.3 (Modelo de Espaço Vetorial) para saber se verbo + sua versão com -se ficam no mesmo synset ou se ficam em synsets diferentes.
Por ex:
"admirar-se" co-ocorre com x y z w
"admirar" co-ocorre com a b c d
Contextos diferentes, sem sobreposição, synsets distintos.
surpreender-se co-ocorre com 1, 2, 3 surpreender co-ocorre com 1, 2, 3, 4 --> contextos sobrepostos, não há motivo para separar o verbo com o -se
Não é para agora também, dependemos de algum aluno, mas tbém nao é difícil. A autora da tese é Phd em Computação, prof do IME, e resolveu fazer um doutorado em linguística "de hobby". Eu dei a sorte de ser colega dela.
e respondo aqui antes de ter lido o do pessoal do NILC relacionado á identificação do -se. Então pode ser que as minhas dúvidas sejam tratadas lá... Concretamente: dei uma boa olhada na lista dos -se e precisamos decidir se:
a) verbos que só aparecem com o pronome serão mantidos com o pronome. Por exemplo, abster-se é sempre com -se; assim como pavonear-se, queixar-se etc. Minha sugestão (que é só uma sugestão! :) é mantê-los sem o pronome, porque: (i) nos precavemos caso haja alguma ocorrência sem o -se (por exemplo, em MG eu sei que adoram omitir o -se, tipo "ele suicidou'. (ii) mantemos os verbos com -se para os casos de alteração de sentido.
b) verbos são polissêmicos, e muitas vezes a versão com -se corresponde a um dos sentidos do verbo. Por exe: contrair / contrair-se --> 1. joão contraiu dengue/ 2. joão contraiu os músculos. "Contrair-se" estará sempre(?) vinculado ao sentido 2, e nao permitirá o 1. O mesmo se aplica a arrumar ("organizar" ou "conseguir" - arrumar um emprego) e arrumar-se (apenas organizar). Mas reparem que estou considerando que "Joana se arrumou para a festa" é o mesmo que "arrumei a casa para a festa", o que é discutível..); mudar / mudar-se (?) ; retirar/retirar-se (?) Mantemos a versão com o -se? (Sinceramente, nao me parece necessário, mas é importante confirmar.
Nos seguintes casos me parece importante termos as duas versões (com e sem o -se), porque o -se traz alguma alteração de sentido:
achar achar-se adiantar adiantar-se admirar admirar-se apoiar apoiar-se arrumar arrumar-se chocar chocar-se comportar comportar-se concentrar concentrar-se conter conter-se contrair contrair-se debater debater-se desdobrar desdobrar-se desfazer desfazer-se dirigir dirigir-se encontrar encontrar-se fazer fazer-se portar portar-se voltar voltar-se
O que acham? um abraço, Cláudia
http://anthology.aclweb.org///W/W13/W13-1014.pdf.
@arademaker , esse artigo tem problemas, conheço de longa data. o -se é um problema em PT, é uma dissertação de mestrado, nao vamos resolver em 1 semana. se fosse simples, já estava feito. A forma como anotamos o -se no Bosque-UD já foi uma tentativa inicial de dar conta disso. O que vc propõe como "precisamos decidir" não é fruto de decisão simples...
a) verbos que só aparecem com o pronome serão mantidos com o pronome. Por exemplo, abster-se é sempre com -se; assim como pavonear-se, queixar-se etc.
NÃO! já tratamos disso muito. Há "fulano queixou de dor"; "fulano formou em letras"; "fulano suicidou".. esse é um dos problemas. Dá uma olhada aqui: https://github.com/own-pt/bosque-UD/issues/134
Opa @claudiafreitas obrigado por comentar , eu só dei um copy paste de mensagens antigas que estavam na minha inbox. Vi que o issue ainda estava aberto e copiei aqui os trechos que achei relevantes . Mas sim. Quero começar a limpar estes issues e decidir o que realmente precisa ser feito