CLUENER2020 icon indicating copy to clipboard operation
CLUENER2020 copied to clipboard

参数求解

Open lmw0320 opened this issue 5 years ago • 0 comments

里面有些参数,看得不是很明白,求指点:

  1. model_name_or_path,解释说是预训练模型的存放位置,或是配置的json文件?还个选择是model list里面的的模型名称--如果使用模型名称,貌似会报错,提示没有max_length的键名;

  2. markup--应该是指标注数据的格式,但是我用的cluener数据集格式,貌似和bios, bio都不一样?

  3. config-name 这个和前面的model_name_or_path有什么关联么? 比如要加载一个预训练模型文件,这个不能随便使用错误的配置文件,否则可能导致预训练模型文件无法加载?

  4. do_lower_case是否选择一个uncased model,这个是什么意思? 是针对英文字母的大小写??

  5. tokenizer_name ?

  6. cache_dir ? 我是直接下载了预训练模型文件,并将其放在了model_name_or_path中,这里为什么还有个从s3下载的模型缓存? 恳请指点。。

lmw0320 avatar Jan 04 '21 08:01 lmw0320