q36101
q36101
请问tusimple、culane和llamas dataset,在评估f1-score时,是使用instance(多类别)还是binary(二分类)的结果?在测试llamas时,因为车道线断断续续,我的instance测试效果很差,与其他论文f1-score=80-90差太多。
我是一位正在研究車道線檢測的學生。我一直對于tusimple數據集有些疑惑,它的train、val、test是有標準的劃分方法嗎?在官網上我沒有看到詳細的說明,只有各數據集的數量。網路上有些人直接從3628個樣本中按照一定比例劃分為訓練、驗證集,有些人則是訓練:3628、測試和驗證:2782。在一些不常見的研究中,甚至直接將樣本按照90%和10%的比例劃分為訓練和測試集。我想請問在進行數據集劃分任務時,一般採用哪種方法比較合適?
Dataset such as Tusimple, CULane, and LLAMAS datasets, do they use instance (multiclass) or binary (binary classification) results when evaluating f1-score?