vietocr icon indicating copy to clipboard operation
vietocr copied to clipboard

Thắc mắc về đầu vào Image, Acc per char

Open KaiKenju opened this issue 1 year ago • 1 comments

Chào a, cảm ơn a vì đã đóng góp sản phẩm này cho cộng đồng, Hiện tại e đang có thắc mắc là:

  • có có thử pretrained lại model của a(run lại ) trong vietocr_gettingstart và ở phần trainer, thì e có chạy 20000iter trong 2h trên colab và acc per char của e khá thấp chỉ đạt 0.63 thì e nên cải thiện điều gì ?

image

  • ngoài ra e vẫn chưa hiểu về cái input: có phải ảnh đầu image đc token hóa thành các vector đặc trưng (word embedding) hay là image đc phân đoạn ra rồi làm phẳng ... image (e vẫn chưa hiểu cốt lõi nó lắm) A có thể giải đáp giúp e với, E cảm ơn. Hi vọng đc a phản hồi sớm.

KaiKenju avatar Mar 15 '24 03:03 KaiKenju

https://pbcquoc.github.io/vietnamese-ocr/ Em tham khảo tài liệu này nhé.

pbcquoc avatar Mar 29 '24 08:03 pbcquoc