UER-py issues

请问user-py的 tokenizer是如何保存和转换的

怎么保存成 transforms 能够直接加载的文件；例如： tokenizer = BertTokenizer.from_pretrained("uer/t5-small-chinese-cluecorpussmall")

cosine similarity为什么会出现负值？用sentence_transformers的util.cos_sim()调用uer/sbert-base-chinese-nli

跑个unit test的时候例句得到负值的cosine similarity，这个是怎么回事？是util.cos_sim函数的问题么？ ```` try: logger.info("START - 加载 Sen-SIMILARITY 模型") # model = SentenceTransformer('distiluse-base-multilingual-cased-v2') model = SentenceTransformer('uer/sbert-base-chinese-nli') # uer model中文性能好很多。 logger.info("FINISH - 加载 Sen-SIMILARITY 模型") except Exception as e: logger.warning("Exception...

peter65374

如何基于 GPT2增量训练或微调实现生成式任务

4

训练数据格式如下：你是文本分类专家，请对文本进行分类，将文本分到以下类别：音乐、体育、娱乐、财经。文本：xxxxxxx 类别是？音乐，娱乐是否可实现这类生成式任务？目前未看到支持的脚本

runningabcd

UER进行文本分类时如何在训练过程中 loss 持续没有降低的情况下进行提前结束训练保存模型进入测试环节

LinLiang66

我想增加LTR和RTL的预训练任务，我需要添加什么类

我有高度结构化且单向关系明显的数据，因此我想尝试使用LTR或RTL的预训练任务替代现有的MLM任务并检查是否有更好的性能，我应该如何修改

TequilaWch

修复ELMO预训练中bilm_target.py的seg参数缺失问题

在预训练ELMO模型时，我发现`bilm_target.py`中的前向传播和后向传播函数调用缺少了`seg`参数传递，这导致了预训练过程中的运行时错误：TypeError: LmTarget.lm() missing 1 required positional argument: 'seg' 此PR修复了这个问题，通过在相关函数调用中加入`seg`参数。这样可以确保在进行前向和后向传播时正确地传递所有必需的参数，从而避免上述类型错误。 **具体更改：** - 在调用`self.lm()`方法时添加了缺失的`seg`参数。 **测试情况：** - 已经在我的开发环境中进行了基本的功能测试，预训练过程现在能够正常执行而不再抛出错误。请审查这些更改，感谢您的时间和努力！

liu673

UER-py
UER-py copied to clipboard

Metadata

LSTM的预训练模型的分词用的是什么

请问user-py的 tokenizer是如何保存和转换的

cosine similarity为什么会出现负值？用sentence_transformers的util.cos_sim()调用uer/sbert-base-chinese-nli

如何基于 GPT2增量训练或微调实现生成式任务

UER进行文本分类时如何在训练过程中 loss 持续没有降低的情况下进行提前结束训练保存模型进入测试环节

我想增加LTR和RTL的预训练任务，我需要添加什么类

修复ELMO预训练中bilm_target.py的seg参数缺失问题

← Metadata

Owner

Metadata

UER-py UER-py copied to clipboard

Metadata

LSTM的预训练模型的分词用的是什么

请问user-py的 tokenizer是如何保存和转换的

cosine similarity为什么会出现负值？用sentence_transformers的util.cos_sim()调用uer/sbert-base-chinese-nli

如何基于 GPT2增量训练或微调实现生成式任务

UER进行文本分类时如何在训练过程中 loss 持续没有降低的情况下 进行提前结束训练 保存模型 进入测试环节

我想增加LTR和RTL的预训练任务，我需要添加什么类

修复ELMO预训练中bilm_target.py的seg参数缺失问题

← Metadata

Owner

Metadata

UER-py
UER-py copied to clipboard

UER进行文本分类时如何在训练过程中 loss 持续没有降低的情况下进行提前结束训练保存模型进入测试环节