CDial-GPT issues

Results 28 CDial-GPT issues

Sort by recently updated

lm_loss类型是str，无法计算loss

您好，我在运行train()时报错 TypeError: unsupported operand type(s) for /: 'str' and 'int' (lm_loss), *_ = model(input_ids, labels=lm_labels, token_type_ids=token_type_ids) loss = lm_loss / args.gradient_accumulation_steps debug发现lm_loss 是str类型，请问是哪里出错了。用的预训练thu-coai/CDial-GPT_LCCC-base模型，"--data_path"是"data/STC.json" 谢谢！

ziqing0701

预训练模型问题

请问原文中用的GPT2-chitchat是直接使用的https://github.com/yangjianxin1/GPT2-chitchat 中提供的训练好的权重model_epoch40_50w吗？

Junlong-Wang

finetune时的log信息在find CDial-GPT_LCCC-large里面的几个json文件，但download下来的CDial-GPT_LCCC-large里面并没有这几个文件，最后报错，报错信息如下，请问是哪里出了问题

INFO:transformers.tokenization_utils:Model name '/dfs/data/ckpt/CDial_GPT/CDial-GPT_LCCC-large' not found in model shortcut name list (bert-base-uncased, bert-large-uncased, bert-base-cased, bert-large-cased, bert-base-multilingual-uncased, bert-base-multilingual-cased, bert-base-chinese, bert-base-german-cased, bert-large-uncased-whole-word-masking, bert-large-cased-whole-word-masking, bert-large-uncased-whole-word-masking-finetuned-squad, bert-large-cased-whole-word-masking-finetuned-squad, bert-base-cased-finetuned-mrpc, bert-base-german-dbmdz-cased, bert-base-german-dbmdz-uncased). Assuming '/dfs/data/ckpt/CDial_GPT/CDial-GPT_LCCC-large' is a path...

haiqizhang

CDial-GPT
CDial-GPT copied to clipboard

Metadata

lm_loss类型是str，无法计算loss

预训练模型问题

finetune时的log信息在find CDial-GPT_LCCC-large里面的几个json文件，但download下来的CDial-GPT_LCCC-large里面并没有这几个文件，最后报错，报错信息如下，请问是哪里出了问题

请问在自己的数据上所有的词都用‘ ’（空格）分开吗？

有关预训练模型的回复结果的问题

请问这个微博原始数据Weibo Corpus有在哪里提供吗？可以分享吗？

这个tokenizer 分词有点慢啊

支持外文吗

← Metadata

Owner

Metadata

CDial-GPT CDial-GPT copied to clipboard

Metadata

← Metadata

Owner

Metadata

CDial-GPT
CDial-GPT copied to clipboard