gImageReader icon indicating copy to clipboard operation
gImageReader copied to clipboard

export to PDF failed

Open efa opened this issue 1 year ago • 8 comments

Using 3.4.2 on Win10: immagine I tryed to export to PDF with options in dialog box attached: immagine but fail with attached error: immagine

It is not clear to me what is the "UnsupportedFontFormat" by PoDoFo and if I can change something to get a PDF?

efa avatar Oct 30 '24 10:10 efa

Looks like the selected font is bad, or at least PoDoFo thinks so. The error message is actually pretty detailed. I assume it works if you select another font?

manisandro avatar Oct 30 '24 10:10 manisandro

OK, I selected Arial and the PDF is generated. It contain few words and lot of errors over background image amministratorePalazzine2024.pdf The same selecting export as text or ODF:

Per esempio per POSse | a
rdinarie e straordinarie, la richiesta di IS da parte del E, e ‘dei

manutenzioni or
manutentori,ecc. insomma per

manutentiva dello stabile.

TELEFONO: 02.400.725.76 —
il Lunedì e Mercoledì pomeriggio dalle ore 15.00 alle ore 17.00

efa avatar Oct 30 '24 11:10 efa

You probably exported the PDF with invisible text overlay. The text is there all-right.

manisandro avatar Oct 30 '24 11:10 manisandro

I saw big differences between the two settings: immagine

Using Testo the OCR is very good:

                                                                         Egr.i Condomini
                                                                 Cornaredo, 14/10/2024

Oggetto: nuovo indirizzo mail e riepilogo contatti studio

Egr. Condomino

E nostra intenzione informarla che abbiamo aggiunto un nuovo indirizzo mail specifico per
tutta la gestione tecnica del Condominio e dei relativi interventi di manutenzione.

La invitiamo, pertanto, a prendere nota del seguente indirizzo mail:

[email protected]

Per quali comunicazioni deve essere utilizzato?
Per esempio per la richiesta di interventi tecnici, la segnalazione di infiltrazioni, di
manutenzioni ordinarie e straordinarie, la richiesta di uscite da parte dei tecnici e dei
manutentori, ecc. insomma per o uaggre di competenza della parte teonica e
manutentiva dello stabile.

Con l'occasione riepiloghiamo tutti i nostri contatti:

* [email protected] : per la gestione delle rate condominiali e dei
  rendiconti e per le informazioni generiche e varie.

* [email protected] : per la gestione dei sinistri e delle pratiche
  assicurative.

* [email protected] : per la gestione delle fatture, pagamenti delle
  stesse, invio fatture di cortesia, note di credito, estratti conto fornitori, ecc.

TELEFONO: 02.400.725.76 — Attivo dal Lunedì al Venerdì dalle ore 09.30 alle ore 12.30 e
il Lunedì e Mercoledì pomeriggio dalle ore 15.00 alle ore 17.00

but using hOCR,PDF the results is poor

efa avatar Oct 30 '24 12:10 efa

Please retest with the latest 3.4.3 release.

manisandro avatar Aug 04 '25 21:08 manisandro

I attach here the JPG image I used for tests: Image The results with hOCR is poor like before. It may depend on the rotation, I saw selecting Text the autozone at first rotate the page to have lines horizontal. Selecting hOCR, and exporting as ODT or TEXT the text is really less than Text options.

While exporting as PDF crash gImageReader after confirmation in Export dialog (I used DejaVu Sans as font). Image I had to kill the app, and it left a 67 bytes invalid PDF file.

Just built 3.4.3 qt5 on Debian 12. On holiday I have no access to Win10 sorry

efa avatar Aug 08 '25 13:08 efa

just tested rotating the image 1.1° clockwise in advance with GIMP, same results

efa avatar Aug 08 '25 13:08 efa

I made some other test using current git master on Debian 13 I do not get the crash on PDF export anymore. The different results between Test and hOCR depend on light and contrast settings. Seems that Testo auto-set those settings to get better results.

Increasing the contrast to 100 and reducing light to -41, I got same results also with hOCR

efa avatar Aug 12 '25 20:08 efa