export to PDF failed
Using 3.4.2 on Win10:
I tryed to export to PDF with options in dialog box attached:
but fail with attached error:
It is not clear to me what is the "UnsupportedFontFormat" by PoDoFo and if I can change something to get a PDF?
Looks like the selected font is bad, or at least PoDoFo thinks so. The error message is actually pretty detailed. I assume it works if you select another font?
OK, I selected Arial and the PDF is generated. It contain few words and lot of errors over background image amministratorePalazzine2024.pdf The same selecting export as text or ODF:
Per esempio per POSse | a
rdinarie e straordinarie, la richiesta di IS da parte del E, e ‘dei
manutenzioni or
manutentori,ecc. insomma per
manutentiva dello stabile.
TELEFONO: 02.400.725.76 —
il Lunedì e Mercoledì pomeriggio dalle ore 15.00 alle ore 17.00
You probably exported the PDF with invisible text overlay. The text is there all-right.
I saw big differences between the two settings:
Using Testo the OCR is very good:
Egr.i Condomini
Cornaredo, 14/10/2024
Oggetto: nuovo indirizzo mail e riepilogo contatti studio
Egr. Condomino
E nostra intenzione informarla che abbiamo aggiunto un nuovo indirizzo mail specifico per
tutta la gestione tecnica del Condominio e dei relativi interventi di manutenzione.
La invitiamo, pertanto, a prendere nota del seguente indirizzo mail:
[email protected]
Per quali comunicazioni deve essere utilizzato?
Per esempio per la richiesta di interventi tecnici, la segnalazione di infiltrazioni, di
manutenzioni ordinarie e straordinarie, la richiesta di uscite da parte dei tecnici e dei
manutentori, ecc. insomma per o uaggre di competenza della parte teonica e
manutentiva dello stabile.
Con l'occasione riepiloghiamo tutti i nostri contatti:
* [email protected] : per la gestione delle rate condominiali e dei
rendiconti e per le informazioni generiche e varie.
* [email protected] : per la gestione dei sinistri e delle pratiche
assicurative.
* [email protected] : per la gestione delle fatture, pagamenti delle
stesse, invio fatture di cortesia, note di credito, estratti conto fornitori, ecc.
TELEFONO: 02.400.725.76 — Attivo dal Lunedì al Venerdì dalle ore 09.30 alle ore 12.30 e
il Lunedì e Mercoledì pomeriggio dalle ore 15.00 alle ore 17.00
but using hOCR,PDF the results is poor
Please retest with the latest 3.4.3 release.
I attach here the JPG image I used for tests:
The results with hOCR is poor like before. It may depend on the rotation, I saw selecting Text the autozone at first rotate the page to have lines horizontal.
Selecting hOCR, and exporting as ODT or TEXT the text is really less than Text options.
While exporting as PDF crash gImageReader after confirmation in Export dialog (I used DejaVu Sans as font).
I had to kill the app, and it left a 67 bytes invalid PDF file.
Just built 3.4.3 qt5 on Debian 12. On holiday I have no access to Win10 sorry
just tested rotating the image 1.1° clockwise in advance with GIMP, same results
I made some other test using current git master on Debian 13 I do not get the crash on PDF export anymore. The different results between Test and hOCR depend on light and contrast settings. Seems that Testo auto-set those settings to get better results.
Increasing the contrast to 100 and reducing light to -41, I got same results also with hOCR