Vu Anh comments

Results 86 comments of


                                            Vu Anh

Thêm các step trong training

Anh vừa check lại thì anh thấy cái này anh làm rồi :D Em đổi method ở [dòng 9 file train.py](https://github.com/undertheseanlp/automatic_speech_recognition/blob/master/experiment/vivos/train.py#L9) thành `lda_mllt` hoặc `sat` để huấn luyện mô hình...

Mô hình có sẵn của ASR

@Pubbus trong tháng 11 xử lý Issue này nhé

Cập nhật báo cáo kỹ thuật

@JackNhat vào review cho anh báo cáo kỹ thuật. liệt kê những điểm còn thiếu nhé. cái này là để em học về xử lý tiếng nói luôn :D

Giúp đỡ: Mình thấy bạn có build thành pack của vosk

@Pubbus trả lời giúp bạn @thongst02 câu hỏi này nhé ;)

Yêu cầu về các package để cài đặt môi trường

Cái này anh sẽ fix trong tháng này @JackNhat nhé

Không chạy được file train.py

@Pubbus đã trở lại à? Các bạn đều rất mong reproduce được thử nghiệm này @Pubbus ạ :D

issues import text_normalize

Duplicate #557

issues import text_normalize

@FamCao `text_normalize` is ready in version 1.3.5 Please check it out ``` pip install underthesea ``` Use `text_normalize` module ``` >>> from underthesea import text_normalize >>> text_normalize('Ðảm baỏ chất lựơng...

Improve tokenizer

@tiendung > `Với TV có lẽ cần bước tiền xử lý các âm tiết trước khi cho vào bộ wordpiece (của BERT). vì nhiều khi mình có nhiều cách bỏ...

Improve tokenizer

> Họ có thử nghiệm Char-based encoding (tương đương với syllable-based trong tiếng Việt) vs Pronunciation-based encoding (chữ tượng thanh) vs Glyph-based encoding (nét chữ tượng hình). Kết quả thế...