fio-de-ariadne icon indicating copy to clipboard operation
fio-de-ariadne copied to clipboard

Melhorar qualidade dos dados: processamento de linguagem natural?

Open cuducos opened this issue 5 years ago • 3 comments

A lógica de raspagem dos dados depende de uma estrutura textual adotada pelo Paraná, o que faz com o que as chances do mesmo script funcionar para estados que não adotam padrão algum nos posts ser baixíssima.

Faz sentido e é factível consideramos abandonar o esquema de expressão regular e testar NLP? Temos volume de dados (categorizados e não categorizados) para isso?

cuducos avatar Mar 10 '20 15:03 cuducos

Faz sentido sim. Posso verificar essa parte.

guilhermevanzinhoffmann avatar Apr 18 '20 23:04 guilhermevanzinhoffmann

Excelente! Eu não sou expert em PLN, então acharia ótimo se alguém explorasse essa parte :purple_heart:

cuducos avatar Apr 18 '20 23:04 cuducos

Olha @guilhermevanzin, posso te ajudar com esta parte, também.

hsteinshiromoto avatar Feb 28 '21 11:02 hsteinshiromoto