HanBert-Transformers
HanBert-Transformers copied to clipboard
Issue about transformers version
μλ νμΈμ. 곡κ°ν΄μ£Όμ μ½λ μ λ§ μ μ©νκ² μ μ°κ³ μμ΅λλ€. κ°μ¬ν©λλ€!
λ€λ¦ μλλΌ transformers 4.0.0 μμ μ 곡ν΄μ£Όμ toy exampleμ κ·Έλλ‘ μ¬μ©ν μ μμ΄μ μ΄λ κ² κΈμ λ¨κΉλλ€.
μλμ κ°μ μλ¬κ° λ°μν©λλ€. (Ubuntuμμ μ€νλμκ³ , λλ ν 리 μ ν λ λμΌνκ² νμ΅λλ€.)
from tokenization_hanbert import HanBertTokenizer
tokenizer = HanBertTokenizer.from_pretrained('HanBert-54kN-torch')
text = "λλ κ±Έμ΄κ°κ³ μλ μ€μ
λλ€. λλκ±Έμ΄ κ°κ³ μλ μ€μ
λλ€. μ λΆλ₯λκΈ°λ νλ€. μ λ¨ΉκΈ°λ νλ€."
tokenizer.tokenize(text)
...
AttributeError: 'HanBertTokenizer' object has no attribute 'vocab'
model outputμ κ΄λ ¨ν toy exampleλ output typeμ΄ λ°λμ΄ μ½κ°μ μμ μ΄ νμνμ§λ§ errorλ λ°μνμ§ μμ΅λλ€.
μ°Έκ³ λ‘ transformers 2.2.2 μμλ λ¬Έμ μμ΄ μ€ν κ°λ₯ν©λλ€.
transformers versionμ λν μꡬμ¬νμ΄ μΆκ°λμ΄μΌν κ² κ°μ μ΄λ κ² κΈμ λ¨κΉλλ€!
tokenization_hanbert.py μμ μλμ κ°μ΄ λ°κΏμ£Όμλ©΄ λ κ² κ°μ΅λλ€. from transformers import PreTrainedTokenizer -> from transformers.tokenization_utils import PreTrainedTokenizer