rltrader
rltrader copied to clipboard
학습속도 관련 질문입니다.
안녕하세요. 먼저 아무것도 모르는 사람이 따라할 가이드같은 책을 출판해주셔서 감사합니다. 올려주신 코드를 다운 받아서 python 3.6/ TF 1.15.0을 기반으로 분봉데이터를 넣고, 다른 지표들을 포함시켜 a3c+lstm 조합으로 학습시켜보고 있습니다.
- 학습하는 동안 gpu 점유율이 낮은게 기존에 제공된 lstm의 깊이가 얕아서인지 궁금합니다
- 학습하는 동안 cpu 점유율이 모든 쓰레드가 골고루 쓰이기는 한데, 각 쓰레드의 점유율이 너무 낮습니다. 원래 강화학습이 이런것인지 아니면 코드 수정을 통해서 점유율을 높이고 속도를 높일수 있는지 궁금합니다.
- 3900X(12코어 24쓰레드)+64GB+3090+우분투으로 학습중인데, cpu를 5950X(16코어 32쓰레드)로 높이면 속도차이가 많이 날지 궁금합니다. 윈도우에서 돌리니 속도가 느려서 우분투로 돌리는 중인데, 윈도우보다는 좀더 빨라졌지만, 아직도 속도가 느린것 같아서 여쭤봤습니다. 긴 글을 읽어주셔서 감사합니다.
@kyle-109 신경망 모델의 fit/predict 비용에 비해 epoch 수행하면서 생기는 pure python loop들의 비용이 클 것으로 추측하고 있습니다. 저도 성능 개선을 준비하고 있고요, 보틀넥이 어딘지 프로파일링 해보고 공유드리겠습니다.