korean-hate-speech
korean-hate-speech copied to clipboard
utils.py read_lines 함수에서 오류가 발생합니다.
UnicodeDecodeError: 'cp949' codec can't decode byte 0xed in position 15: illegal multibyte sequence가 발생해서 직접 파일에 들어가서 open함수에 encoding='UTF-8'을 추가했더니 되더라구요 실행환경마다 다른지는 모르겠는데 수정이 필요할 것 같습니다.
혹시 Python2에서 실행하셨나요? 만약 Python2에서 실행했다면 기본 codec가 ascii (+Korean: cp949 확장) 입니다.