tesseract
tesseract copied to clipboard
jumbled textonly_pdf character spacing
Environment
- Tesseract Version: tesseract 4.1.1 (leptonica-1.79.0)
- Platform: Linux 5.4.19 (slackware-current x86_64)
Current Behavior:
Using options
tessedit_create_pdf 1 Write .pdf output file
textonly_pdf 1 Create PDF with only one invisible text layer
to create a text-only PDF, changing its 3 Tr
to 0 Tr
, and substituting the glyphless font for a glyphed one, produces:
pdftotext
output:
62
CHAPITRE
III
marquons aussi la connexion entre l’incorruptibilité des corps
célestes, leur exemption de la contrariété et le fait que leur mouvement est circulaire.
3.
IV
Sent.,
47, 2, 2, 2, c. Sed
haec
opinio
est omnino
absurda:
repugnat enim et philosophiae, secundum quam poni non potest quod
corpora inferiora sint in potentia ad formam caeli, cum nec materiam
habeant communem,
nec contrarietatem ad invicem; et etiam theo-
logiae, quia secundum hanc positionem non salvabitur perfectio universi cum integritate suarum partium, duobus elementis sublatis.
Contexte doctrinal, La fin du monde et la consommation de
toutes choses par le feu: S. Thomas rejette diverses opinions
erronées, notamment celle selon laquelle la terre et l'air resteront terre et air, tandis que l’eau et le feu deviendront ciel, alors
qu’entre eux et le ciel la matière n’est pas commune et il n’y a
pas contrariété.
Remarquons, ici encore, la connexion entre l'incorruptibilité
et l’ingénérabilité du ciel, l’absence d’une matière commune
entre corps célestes et corps inférieurs, et l’absence de contrariété.
4. De ver., 8, 15, c. (Utrum Angeli cognoscant res discurrendo de
uno in aliud). Intellectus autem angeli a sua creatione per formas
innatas est perfectus respectu totius cognitionis ad quam se extendit
virtus
intellectiva;
sicut ef materia
caelestium
corporum
totaliter est
perfecta vel terminata per formam, ita quod non remanet in
ad aliam formam; et propter hoc dicitur in libro De causis,
telligentia est plena formis. Non enim esset plena, nisi tota
tentia per formas illas terminaretur; unde nihil eorum quae
liter cognoscere potest, est ei ignotum.
potentia
quod insua ponatura-
Contexte doctrinal. Contraste entre l’intellect humain diseursif et l'intellect angélique parfait d’emblée.
S. Thomas continue le corps de l’article en montrant que l’intellect humain, au contraire de celui des anges, est perpétuellement imparfait et en mouvement vers sa perfection. Mais il
ne rappelle pas que cette condition de l'intellect humain ressemble à celle de la matière des corps inférieurs, elle aussi toujours
Expected Behavior:
Modifying the output of ABBYY FineReader 11.0 similarly produces:
pdftotext
output
62
CHAPITRE III
marquons aussi la connexion entre l’incorruptibilité des corps
célestes, leur exemption de la contrariété et le fait que leur mou¬
vement est circulaire,
3. /V Sent., 47, 2, 2, 2, c. Sed haec opinio est omnino absurda:
répugnât enim et philosophiae, secundum quam poni non potest quod
corpora inferiora sint in potentia ad formam caeli, cum nec materiam
habeant communem, nec contrarietatem ad invicem; et etiam theologiae, quia secundum hanc positionem non salvabitur perfectio unlversi cum integritate suarum partium, duobus elementis sublatis.
Contexte doctrinal. La fin du monde et la consommation de
toutes choses par le feu: S. Thomas rejette diverses opinions
erronées, notamment celle selon laquelle la terre et l’air reste¬
ront terre et air, tandis que l’eau et le feu deviendront ciel, alors
qu’entre eux et le ciel la matière n’est pas commune et il n’y a
pas contrariété.
Remarquons, ici encore, la connexion entre l’incorruptibilité
et l’ingénérabiîité du ciel, l’absence d’une matière commune
entre corps célestes et corps inférieurs, et l’absence de contra¬
riété.
4. De ver., 8, 15, c. (Utrum Angeli cognoscant res discurrendo de
uno in aliud). Intellectus autem angeli a sua creatione per formas
innatas est perfectus respectu totius cognitionis ad quam se extendit
virtus intellectiva ; sicut et materia caelestium corporum totaliter est
perfecta vel terminata per formam, ita quod non remanet in potentia
ad aliam formam; et propter hoc dicitur in libro De causis, quod in¬
telligente est plena formis. Non enim esset plena, nisi tota sua po¬
tentia per formas illas terminaretur; unde nihil eorum quae naturaliter cognoscere potest, est ei ignotum.
Contexte doctrinal. Contraste entre l’intellect humain discur¬
sif et l’intellect angélique parfait d’emblée.
5. Thomas continue le corps de l’article en montrant que l’in¬
tellect humain, au contraire de celui des anges, est perpétuel¬
lement imparfait et en mouvement vers sa perfection. Mais il
ne rappelle pas que cette condition de
Files
Attach the PDF and input image to bug, please.
@jbreiden See the added "Files" section.
I also have this issue with all PDFs produced by tesseract