pdftools icon indicating copy to clipboard operation
pdftools copied to clipboard

Inserts empty lines and spaces between letters of random words

Open aourednik opened this issue 6 years ago • 0 comments

Inserts empty lines and spaces b e t w e e n letters of r a n d o m words.

This text:

original

Becomes this text:

"Numéro 476. Japon f i n i t mal l'année. Peuple privé de tout sans

i l l u s i o n s quoique la presse ramène l e s revers successifs aux

Philippines et en Birmanie aux proportions escarmouches entre

avions. Situation économique toujours lamentable et prix a t -

teignent un niveau i n o u i . Conditions en Mandchourie meilleures

mais faute de transports et organisation, vivres de c e t t e c o l o -

nie arrivent d i f f i c i l e m e n t e t peuple s o u f f r e de l a faim et du

froid. Malaise accru par perturbations du t r a f i c f e r r o v i a i r e"

Already existing OCR in the PDF has no spaces. The direct copy-paste from Acrobat Pro DC looks like this:

"Numéro 476. Japon finit mal l'année. Peuple privé de tout sans illusions quoique la presse ramène les revers successifs aux Philippines et en Birmanie aux proportions escarmouches entre avions. Situation économique toujours lamentable et prix at¬ teignent un niveau inoui. Conditions en Mandchourie meilleures mais faute de transports et organisation, vivres de cette colo¬ nie arrivent difficilement et peuple souffre de la faim et du froid. Malaise accru par perturbations du trafic ferroviaire"

R version 3.2.5 (2016-04-14) Platform: i386-w64-mingw32/i386 (32-bit) Running under: Windows 7 (build 7601) Service Pack 1

locale: [1] LC_COLLATE=French_Switzerland.1252 LC_CTYPE=French_Switzerland.1252
[3] LC_MONETARY=French_Switzerland.1252 LC_NUMERIC=C
[5] LC_TIME=French_Switzerland.1252

aourednik avatar Feb 27 '18 10:02 aourednik