fio-de-ariadne
fio-de-ariadne copied to clipboard
Melhorar qualidade dos dados: processamento de linguagem natural?
A lógica de raspagem dos dados depende de uma estrutura textual adotada pelo Paraná, o que faz com o que as chances do mesmo script funcionar para estados que não adotam padrão algum nos posts ser baixíssima.
Faz sentido e é factível consideramos abandonar o esquema de expressão regular e testar NLP? Temos volume de dados (categorizados e não categorizados) para isso?
Faz sentido sim. Posso verificar essa parte.
Excelente! Eu não sou expert em PLN, então acharia ótimo se alguém explorasse essa parte :purple_heart:
Olha @guilhermevanzin, posso te ajudar com esta parte, também.