pdf2dataset
pdf2dataset copied to clipboard
Converts a whole subdirectory with a big (or small) volume of PDF documents to a dataset (pandas DataFrame) with error tracking and choice of features
Results
12
pdf2dataset issues
Sort by
recently updated
recently updated
newest added
O método [`extract_text`](https://github.com/icaropires/pdf2dataset/blob/master/pdf2dataset/utils.py#L41) com a opção **return_list** retorna atualmente uma lista de lista de strings. Acredito que o retorno poderia ser refatorado para retornar apenas uma lista de strings. Por...
feature-request
Acredito que seja interessante segmentar as dependências do projeto entre `install_requires` e `extras_require` para comportar melhor o uso das funcionalidades disponibilizadas. Por exemplo, para casos de uso que utilizem apenas...
feature-request