guilhermelowa
guilhermelowa
Just used Texthero for the first time yesterday in Portuguese. Pipeline for preprocessing seems fine, except for stopwords. A solution like @AlfredWGA mentioned would be very much appreciated inside hero....
> > Just used Texthero for the first time yesterday in Portuguese. Pipeline for preprocessing seems fine, except for stopwords. A solution like @AlfredWGA mentioned would be very much appreciated...
I'd like that! Can't make guarantees though, since I'm already involved in many projects ): I'll try to do it until Saturday. I still have some questions, which might be...
Tenho uma ideia sobre como fazer, mas não sei depois como colocar em produção: Remove as stop words do texto; Transforma o texto pra [vetores de palavras](http://www.nilc.icmc.usp.br/embeddings); Roda um algoritmo...
Massa! Qual é o dataset? São todos que tão lá no Kaggle?
Acho que informação temos, sim. A metodologia fica a cargo do leitor. Eu tinha pensado em fazer inicialmente, dados todas as despesas, quais são os outliers? A partir daí sofisticar...
Ahh, massa! Mas dá pra outras pessoas contribuírem, na Wiki? Minha ideia com a Issue é que qualquer pessoa poderia postar aqui outra fonte. E aí a gente ver com...
Ótimo! Particularmente prefiro assim como você falou. Diminui o custo das pessoas contribuirem e da gente organizar.
[Panorama Municipal](https://www.manual2020.com.br/panorama-municipal) - Manual do Insper para as eleições municipais de 2020 com explicações sobre a máquina (qual dever de cada político local), receita e políticas municipais
@anapaulagomes acho que cabe colocar lá na Wiki um link pra essa Issue, pra quem entrar por lá primiero poder chegar até aqui e colaborar. O que acha?