Xinjie Lin comments

Results 50 comments of


                                            Xinjie Lin

BERT添加新的预训练任务

我的关注点可能只在bert部分，但是uer版本是集成化的，用起来很方便，但是想改预训练部分自己找不出比较完整的代码逻辑，能否关于bert进行预训练部分做一些代码结构的说明？

BERT添加新的预训练任务

我读了几遍代码和查了一点资料，大概清楚整体的调用逻辑，但是还有些细节不太清楚，想问一下在uer/models/model.py中前向网络的参数是从哪里调用的，我从pretrain跟踪到这一块似乎没看到这部分参数是哪里来的，本身对torch的了解也不深，希望作者帮忙我理清一下代码。

请求增加论文列表

我不是做前端开发的，但是作者如果同意，我想试试参与做一些修改来支持我所在单位的论文列表。

> 感谢您的建议！ > > 我觉得这个功能很棒啊~CCF 目录之外有一些优秀的会议和期刊值得我们关注，增加“自选的关注列表”是个好主意。 > > 欢迎您提交 Pull Requests~非常欢迎有小伙伴加入，我们一起维护这个小插件。 > > * [ ] 增加自选关注列表。 > > 再次感谢您的建议~ 期待作者的更新，同时谢谢作者的认同，我现在已经有一份json列表，需要对现有插件的哪些地方做修改补充?

请求增加论文列表

> 好棒好棒！执行力满分~ > 请允许我先解决 #7 ，确定了匹配规则，再来完成自选列表的功能哈~ > > 我们可以先一起设计下这个功能的workflow。我的初步想法如下： > > 1. 请用户在选项页面（见[Give users options](https://developer.chrome.com/docs/extensions/mv3/options/)）中提供“自选关注列表”。 > > * 计划输入格式为`---`。 > > * 示例输入（字符串匹配的情况下）：`Lin-ICLR-International Conference on Learning Representations-ICLR` > * 示例输入（URL匹配的情况下）：`Lin-ICLR-International...

一些著名会议没有被标识

在IEEEXplore和Springer的识别不太准确，像INFOCOM是顶会但是显示CCF-None。 ![image](https://user-images.githubusercontent.com/20349381/164581329-35ae0193-4170-4f62-bde0-2d8e0f75f3b4.png)

模型效果差的问题

> 大佬，你好，我们拿自己训练的模型，跑另一个相同分布的测试数据，效果很差，模型很容易过拟合，你们发现了吗我们在拿来测试的公开数据集目前还没有遇到过拟合的问题，可以细说一下你的数据情况吗？

模型效果差的问题

> 拿另外一批数据作为测试，想测试下模型的泛化能力这种场景不在已开源的模型解决范围中，我们也在开展新的工作，其中一部分是解决你提及的这个问题。欢迎交流。

模型效果差的问题

> > > > > > 大佬，你好，我们拿自己训练的模型，跑另一个相同分布的测试数据，效果很差，模型很容易过拟合，你们发现了吗 > > > > > > 我们在拿来测试的公开数据集目前还没有遇到过拟合的问题，可以细说一下你的数据情况吗？ > > 不是数据的问题，是如何划分训练集验证集测试集的问题，你代码的方法随机选择split完的flow或者packet作为测试集，我是随机选择没有split之前的原始的pcap文件作为测试集，这种情况你们尝试过吗？这种我们没试过

模型效果差的问题

> > > > > > > > > > > > > > > 大佬，你好，我们拿自己训练的模型，跑另一个相同分布的测试数据，效果很差，模型很容易过拟合，你们发现了吗 > > > > > > > > > > > > 我们在拿来测试的公开数据集目前还没有遇到过拟合的问题，可以细说一下你的数据情况吗？ >...