wudejian789
wudejian789
> 训练的时候没有涉及。实际上对于这两个token,在下游任务中随机初始化来训练几乎不会增加难度。 好的 十分感谢
那是有个队友给的,但没什么用,模型里也没用过这个特征。 可能他是把某几条蛋白放到蛋白数据库里比对出来然后各氨基酸平均这种吧。
这个是新版sklearn的train_test_split函数已经不支持test_size为0的情况了。你可以将test_size设置为一个很小的值以保证绝大多数数据进行训练。一般来说test_size是需要设置以评判模型的泛化性能,但是在seq2seq模型的聊天机器人中,没有一个较好的泛化性能评价指标,所以测试集的分数仅仅作为参考,可以不用在意训练集分数远远超过测试集分数的情况。 我有时间会修复一下这个问题。
我没有用过tensorboard的可视化,抱歉。不过你可以尝试一下,加油(ง •̀_•́)ง
这个取决于你训练时设置的epoch大小,建议这个25w的语料训练,得使用1080TI。不然从remaining time可以看出,这个剩余的训练时间有些太长了。
> 您好,我是百度飞桨运营,看了您的项目觉得很优秀,希望能与您取得联系,请问可以加一下我的微信(paddlehelp)备注飞桨开发者么? > 期待您的回复~ 您好,抱歉才回复;我搜了下微信(paddlehelp)好像并没有搜到这个微信号,我的微信号是wodejian789,如果还有需要可以加我微信。
Sorry to reply so late. I'm a fresh man in paddle and Github. I'm very sorry for the manager of Baidu Nuandong Fang's attitude. I might not implement YOLO on...