Facico comments

Results 234 comments of


                                            Facico

这是什么情况，后面的回答都是回答的第一个问题？

你用的是我们医疗问答的checkpoint吗，我们医疗问答还没适配多轮对话性的代码（global instruction）不一样

考虑将BELLE的3.5M 数据加入chat数据吗？

@DENGFEIYANG 可以看这里，https://huggingface.co/datasets/Chinese-Vicuna/instruct_chat_50k.jsonl

generate和interaction都无法停止，直到达到max_tokens限制才会停止

你现在仓库的版本是最新版的吗，我看这个UI界面好像没有min_new_tokens

generate和interaction都无法停止，直到达到max_tokens限制才会停止

如果使用我们的模型能成功停止吗

generate和interaction都无法停止，直到达到max_tokens限制才会停止

download和huggingface一个是用的https://agi.gpt4.org/llama/LLaMA/，一个是他们传在huggingface上的，我们之前使用两种方式都是正常的。不清楚第一个链接中后台是否有修改，不过huggingface上的修改是能看到修改记录的可以加载我们在huggingface上的lora模型看能否正常停止，llama他们的tokenizer后面好像有[变过](https://huggingface.co/decapoda-research/llama-7b-hf/discussions?status=all)，因为我们finetune中用的是默认的eos，你可以尝试输出一下模型的eos是什么，或者看一下相关配置中eos应该对应哪个

generate和interaction都无法停止，直到达到max_tokens限制才会停止

@rookiebird 我跑了一下确实是和你不一样 ``` print(tokenizer.eos_token_id) print(tokenizer.bos_token_id) print(tokenizer._convert_token_to_id(tokenizer.bos_token)) print(tokenizer._convert_token_to_id('')) print(tokenizer._convert_token_to_id('')) 2 1 0 1 2 ```

generate和interaction都无法停止，直到达到max_tokens限制才会停止

@rookiebird 今天的事情比较多，抱歉回复这么晚。可能因为huggingface的tokenizer相关的问题，transformers最新的代码中的llama将他们的tokenzier的路径给修改了，见[这里](https://github.com/huggingface/transformers/commit/c0f99b4d2ec73090595914dde4c16da207e21d73)。关于上面的问题，我们的tokenzier_config和你是一样的，bos和eos那里都是空的，如下 ``` {"bos_token": "", "eos_token": "", "model_max_length": 1000000000000000019884624838656, "tokenizer_class": "LLaMATokenizer", "unk_token": ""} ``` 所以我们的tokenizer.bos_token和tokenizer.eos_token都是空的，对应的是0 但上面的`tokenizer.eos_token_id`和`tokenizer.bos_token_id`这里，它调用的是sentencepiece的接口求的，这个接口导入的是tokenizer.model这个文件，我估计就是这个文件的东西我们不一样。 transformers他们最新的代码好像将tokenizer.model这个换到了新的链接，我还没试过最新的版本，不过可能有所改善。 add_eos设置的是true，add_bos llama代码中默认的是true

Facico

这是什么情况，后面的回答都是回答的第一个问题？

考虑将BELLE的3.5M 数据加入chat数据吗？

generate和interaction都无法停止，直到达到max_tokens限制才会停止

generate和interaction都无法停止，直到达到max_tokens限制才会停止

generate和interaction都无法停止，直到达到max_tokens限制才会停止

generate和interaction都无法停止，直到达到max_tokens限制才会停止

generate和interaction都无法停止，直到达到max_tokens限制才会停止

generate和interaction都无法停止，直到达到max_tokens限制才会停止

chat.py生成结果的时候，GPU的显存会持续增加，最后显存溢出

chat.py生成结果的时候，GPU的显存会持续增加，最后显存溢出