Xinjie Lin
Xinjie Lin
我的关注点可能只在bert部分,但是uer版本是集成化的,用起来很方便,但是想改预训练部分自己找不出比较完整的代码逻辑,能否关于bert进行预训练部分做一些代码结构的说明?
我读了几遍代码和查了一点资料,大概清楚整体的调用逻辑,但是还有些细节不太清楚,想问一下在uer/models/model.py中前向网络的参数是从哪里调用的,我从pretrain跟踪到这一块似乎没看到这部分参数是哪里来的,本身对torch的了解也不深,希望作者帮忙我理清一下代码。
我不是做前端开发的,但是作者如果同意,我想试试参与做一些修改来支持我所在单位的论文列表。
> 感谢您的建议! > > 我觉得这个功能很棒啊~CCF 目录之外有一些优秀的会议和期刊值得我们关注,增加“自选的关注列表”是个好主意。 > > 欢迎您提交 Pull Requests~非常欢迎有小伙伴加入,我们一起维护这个小插件。 > > * [ ] 增加自选关注列表。 > > 再次感谢您的建议~ 期待作者的更新,同时谢谢作者的认同,我现在已经有一份json列表,需要对现有插件的哪些地方做修改补充?
> 好棒好棒!执行力满分~ > 请允许我先解决 #7 ,确定了匹配规则,再来完成自选列表的功能哈~ > > 我们可以先一起设计下这个功能的workflow。我的初步想法如下: > > 1. 请用户在选项页面(见[Give users options](https://developer.chrome.com/docs/extensions/mv3/options/))中提供“自选关注列表”。 > > * 计划输入格式为`---`。 > > * 示例输入(字符串匹配的情况下):`Lin-ICLR-International Conference on Learning Representations-ICLR` > * 示例输入(URL匹配的情况下):`Lin-ICLR-International...
在IEEEXplore和Springer的识别不太准确,像INFOCOM是顶会但是显示CCF-None。 
> 大佬,你好,我们拿自己训练的模型,跑另一个相同分布的测试数据,效果很差,模型很容易过拟合,你们发现了吗 我们在拿来测试的公开数据集目前还没有遇到过拟合的问题,可以细说一下你的数据情况吗?
> 拿另外一批数据作为测试,想测试下模型的泛化能力 这种场景不在已开源的模型解决范围中,我们也在开展新的工作,其中一部分是解决你提及的这个问题。欢迎交流。
> > > > > > 大佬,你好,我们拿自己训练的模型,跑另一个相同分布的测试数据,效果很差,模型很容易过拟合,你们发现了吗 > > > > > > 我们在拿来测试的公开数据集目前还没有遇到过拟合的问题,可以细说一下你的数据情况吗? > > 不是数据的问题,是如何划分训练集验证集测试集的问题,你代码的方法随机选择split完的flow或者packet作为测试集,我是随机选择没有split之前的原始的pcap文件作为测试集,这种情况你们尝试过吗? 这种我们没试过
> > > > > > > > > > > > > > > 大佬,你好,我们拿自己训练的模型,跑另一个相同分布的测试数据,效果很差,模型很容易过拟合,你们发现了吗 > > > > > > > > > > > > 我们在拿来测试的公开数据集目前还没有遇到过拟合的问题,可以细说一下你的数据情况吗? >...