Marc

Results 53 comments of Marc

Le scénario n'est pas minimal - cf. lignes 23 à 25 de minimal_scenario._kh ~~~ TrainDatabase.HeaderLineUsed true TrainDatabase.FieldSeparator TrainDatabase.DatabaseFormatDetector.DetectFileFormat ~~~ - un "DetectFileFormat" est ajouté suite a la spécification du flag...

Bruno a reproduit le problème sur un e-buro, avec même un comportement pire que sur ma machine (ok après une demi-douzaine d'essais). La meilleurs hypothèse est que ce soit un...

Mise en place d'un installeur Windows signé, contenant les binaires MODL.exe et MODL_Coclustering.exe signés - disponible dans l'espace release de la 10.2.2 - cela marche nettement mieux, mais il reste...

Précision: ceci n'est pas encore une spécification. Il s'agit essentiellement de réflexions en cours, à maturer, en vue de finaliser la refonte du moteur de templating pour python plus une...

Suite à un Poc d'extraction automatique de l'API par introspection des fonctions de l'API core, via leur signature et leur docstring, cette proposition parait pertinente. Je propose même de la...

Je viens de créer un jeu de test contenant des textes multi-lignes, dans LearningTest\TestKhiops\TextVariables\MultiLineTexts Les lignes correspondantes sont ignorées, avec deux types de warning: - pour la première ligne du...

Ci-dessous un script python qui a permis de recoder le jeu de test NegativeAirlineTwwets (cf. issue https://github.com/KhiopsML/khiops/issues/566), et pourras alimenter une Q&A. ``` import pandas as pd def preprocess_tweets(): """Preprocess...

Suggestion: en cas d'erreur de type `missing double-quote at the end of the field` détecté au moins une fois dans l'analyse d'une base, émettre une recommandation de recodage de la...

Le jeu de données textuel https://www.kaggle.com/datasets/subhajournal/phishingemails comporte de très nombreux enregistrements multi-lignes: - 18650 enregistrements (dont un de plus de 16 Mb) - plus de 175000 lignes au total Suite...

# Spécification d'évolution de la gestion des problèmes de double-quotes dans les champs de bases de données ## Rappels sur l'existant ### Norme d'encodage csv cf. https://fr.wikipedia.org/wiki/Comma-separated_values `Les champs texte...