python-datascientist icon indicating copy to clipboard operation
python-datascientist copied to clipboard

Coquilles tuto Elastic

Open jpramil opened this issue 1 year ago • 2 comments

Probables pb de copié-collé :

"Un index est une collection de documents dans lesquels on souhaite chercher, préalablement ingérés dans un moteur de recherche les documents sont les établissements. L’indexation consiste à pré-réaliser les traitements des termes des documents pour gagner en efficacité lors de la phase de recherche. L’indexation est faite une fois pour de nombreuses recherches potentielles, pour lesquelles la rapidité de réponse peut être cruciale. Après avoir indexé une base, on effectuera des requêtes qui sont des recherches d’un document dans la base indexé (équivalent de notre web) à partir de termes de recherche normalisés."

jpramil avatar Nov 02 '23 10:11 jpramil

Non affichage des df lors des premiers preprocess : " A l’issue de la question 1, le jeu de données ciqual devrait ressembler à celui-ci: Après avoir mis en majuscule, on se retrouve avec le jeu de données suivant: Après retrait des stop-words, nos libellés prennent la forme suivante : La regex pour éliminer les caractères de ponctuation permet ainsi d’obtenir: Enfin, à l’issue de la question 5, le DataFrame obtenu est le suivant: Ces étapes de nettoyage ont ainsi permis de concentrer l’information dans les noms de produits sur ce qui l’identifie vraiment. "

jpramil avatar Nov 02 '23 12:11 jpramil

Fichier schema.json disparu (pour le mapping)

jpramil avatar Nov 02 '23 13:11 jpramil