llm-lora-classification icon indicating copy to clipboard operation
llm-lora-classification copied to clipboard

loss の計算方法:loss -> total_loss ??

Open u-masao opened this issue 4 months ago • 0 comments

@hppRC

素晴らしいリポジトリを公開して頂きありがとうございます。 色々なLLMで実験をしており、非常に勉強になっています。

Expeiment.evaluate() での loss の計算が適正ではないように思いましたので Issue をあげさせて頂きます。

実装では最後のバッチの loss をdataset 数で割っているようですが、total_loss / len(dataloader.dataset) が適切ではないでしょうか。

https://github.com/hppRC/llm-lora-classification/blob/dd233acdcda94e405b9900afa151d55b69412291/src/train.py#L236-L242

u-masao avatar Jul 27 '25 14:07 u-masao