hanja
hanja copied to clipboard
인식하지 못하는 한자
𤍠(\u24360) 𨽾(\u28F7E) 이런 한자들을 처리하게 하려면 어떻게 해야 하나요?
- 「𤍠」(U+24360)은 「더울 熱」의 이체자(동자; semantic variant)라고 합니다. 따라서 독음은 “열”이 되겠습니다.
- 「𨽾」(U+28F7E)은 「종(노예) 隸」의 이체자라고 합니다. 따라서 독음은 “례”(“예”)가 되겠습니다.
@suminb table.yml에 추가하면 될 것 같습니다.
제보 감사합니다. 사실 똑같이 생긴 한자가 다른 유니코드 값을 가지고 있는 케이스가 꽤 많이 있어서 포괄적인 대응이 필요한 상황이지만, table.yml
에 해당 글자를 추가하여 제보 주신 내용이라도 임시로 해결해볼 수는 있을 것 같습니다.
사실 똑같이 생긴 한자가 다른 유니코드 값을 가지고 있는 케이스가 꽤 많이 있어서 포괄적인 대응이 필요한 상황이지만
Unicode Han Database에서 그런 관계를 나타내기 위해 kSemanticVariant
필드를 제공하고 있습니다. 이를 활용하면 좋을 것 같습니다.