pointer-generator icon indicating copy to clipboard operation
pointer-generator copied to clipboard

train 和eval时间

Open jichangzhen opened this issue 5 years ago • 6 comments

不知道train 和eval到什么程度可以去解码,训练多长时间

jichangzhen avatar Aug 23 '19 11:08 jichangzhen

我也想请教下,刚跑这个代码,不太懂eval是要和train同时跑么?

trc1998428 avatar Mar 16 '20 18:03 trc1998428

不是,是分开跑的

发自我的iPhone

------------------ 原始邮件 ------------------ 发件人: trc <[email protected]> 发送时间: 2020年3月17日 02:53 收件人: abisee/pointer-generator <[email protected]> 抄送: jichangzhen <[email protected]>, Author <[email protected]> 主题: 回复:[abisee/pointer-generator] train 和eval时间 (#152)

我也想请教下,刚跑这个代码,不太懂eval是要和train同时跑么?

— You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub, or unsubscribe.

jichangzhen avatar Mar 20 '20 06:03 jichangzhen

论文中有详细说明:

数据集:CNN/Daily Mail

  • 训练集大小287,226
  • 验证集大小13,368
  • 测试集大小11,490

GPU型号:Tesla K40m GPU

超参数

  • batch size:16

训练轮数及时间

  • 230,000轮(12.8个epoch),耗时3天4小时
  • coverge:额外训练3000轮,耗时约2小时

googlx avatar Jun 21 '20 09:06 googlx

不是,是分开跑的 发自我的iPhone ------------------ 原始邮件 ------------------ 发件人: trc <[email protected]> 发送时间: 2020年3月17日 02:53 收件人: abisee/pointer-generator <[email protected]> 抄送: jichangzhen <[email protected]>, Author <[email protected]> 主题: 回复:[abisee/pointer-generator] train 和eval时间 (#152) 我也想请教下,刚跑这个代码,不太懂eval是要和train同时跑么? — You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub, or unsubscribe.

这个eval要跑到什么时候以及作用是什么,eval跑完了之后还需要在跑train吗?我这边是把train阶段终止了之后再去跑这个eval,发现log/eval目录下什么也没有呀,难道他的功能就只是保存最好的模型到log/train目录中吗?

hustcxx avatar Nov 11 '20 01:11 hustcxx

这个eval的意思是不是,只在测试集上计算了训练结束最后的一个模型?

XuemingQiu avatar Dec 13 '20 09:12 XuemingQiu

这个eval要跑到什么时候以及作用是什么,eval跑完了之后还需要在跑train吗?我这边是把train阶段终止了之后再去跑这个eval,发现log/eval目录下什么也没有呀,难道他的功能就只是保存最好的模型到log/train目录中吗?

同问,这个eval要跑多久,作用是啥呢?

yuzexin05 avatar Mar 02 '22 13:03 yuzexin05