CLUENER2020
CLUENER2020 copied to clipboard
参数求解
里面有些参数,看得不是很明白,求指点:
-
model_name_or_path,解释说是预训练模型的存放位置,或是配置的json文件?还个选择是model list里面的的模型名称--如果使用模型名称,貌似会报错,提示没有max_length的键名;
-
markup--应该是指标注数据的格式,但是我用的cluener数据集格式,貌似和bios, bio都不一样?
-
config-name 这个和前面的model_name_or_path有什么关联么? 比如要加载一个预训练模型文件,这个不能随便使用错误的配置文件,否则可能导致预训练模型文件无法加载?
-
do_lower_case是否选择一个uncased model,这个是什么意思? 是针对英文字母的大小写??
-
tokenizer_name ?
-
cache_dir ? 我是直接下载了预训练模型文件,并将其放在了model_name_or_path中,这里为什么还有个从s3下载的模型缓存? 恳请指点。。