Vu Anh
Vu Anh
Anh vừa check lại thì anh thấy cái này anh làm rồi :D Em đổi method ở [dòng 9 file train.py](https://github.com/undertheseanlp/automatic_speech_recognition/blob/master/experiment/vivos/train.py#L9) thành `lda_mllt` hoặc `sat` để huấn luyện mô hình...
@Pubbus trong tháng 11 xử lý Issue này nhé
@JackNhat vào review cho anh báo cáo kỹ thuật. liệt kê những điểm còn thiếu nhé. cái này là để em học về xử lý tiếng nói luôn :D
@Pubbus trả lời giúp bạn @thongst02 câu hỏi này nhé ;)
Cái này anh sẽ fix trong tháng này @JackNhat nhé
@Pubbus đã trở lại à? Các bạn đều rất mong reproduce được thử nghiệm này @Pubbus ạ :D
Duplicate #557
@FamCao `text_normalize` is ready in version 1.3.5 Please check it out ``` pip install underthesea ``` Use `text_normalize` module ``` >>> from underthesea import text_normalize >>> text_normalize('Ðảm baỏ chất lựơng...
@tiendung > `Với TV có lẽ cần bước tiền xử lý các âm tiết trước khi cho vào bộ wordpiece (của BERT). vì nhiều khi mình có nhiều cách bỏ...
> Họ có thử nghiệm Char-based encoding (tương đương với syllable-based trong tiếng Việt) vs Pronunciation-based encoding (chữ tượng thanh) vs Glyph-based encoding (nét chữ tượng hình). Kết quả thế...