pdf2dataset icon indicating copy to clipboard operation
pdf2dataset copied to clipboard

Converts a whole subdirectory with a big (or small) volume of PDF documents to a dataset (pandas DataFrame) with error tracking and choice of features

Results 12 pdf2dataset issues
Sort by recently updated
recently updated
newest added

O método [`extract_text`](https://github.com/icaropires/pdf2dataset/blob/master/pdf2dataset/utils.py#L41) com a opção **return_list** retorna atualmente uma lista de lista de strings. Acredito que o retorno poderia ser refatorado para retornar apenas uma lista de strings. Por...

feature-request

Acredito que seja interessante segmentar as dependências do projeto entre `install_requires` e `extras_require` para comportar melhor o uso das funcionalidades disponibilizadas. Por exemplo, para casos de uso que utilizem apenas...

feature-request