RecSysDatasets icon indicating copy to clipboard operation
RecSysDatasets copied to clipboard

This is a repository of public data sources for Recommender Systems (RS).

Results 22 RecSysDatasets issues
Sort by recently updated
recently updated
newest added

Hi, I tried to add the `convert_item()` function to get the text data officially provided in the MIND dataset. Therefore, we could use not only the interaction data but also...

我想请问一下官网显示的支持.net的原子文件,但是在官网数据集中并没有找到,github转换工具也没有转为.net原子文件代码,请问一下是该部分还不支持嘛

在你们提供的百度网盘 https://pan.baidu.com/s/1p51sWMgVFbAaHQmL4aD_-g 里,RecBole>ProcessedDatasets>Gowalla目录下,有两个目录:merged和not_merged。请问这两个东西有什么不同呢?是去重和不去重的区别吗?以及,如果用你们RecBole框架获取gowalla数据集,得到的是其中哪一个呢?

question

请问一下您们在序列推荐这个任务下对一些模型的数据预处理工作是什么样的呢,比如一个会话序列是[1,2,3,4],请问您对其的处理过程是仅使用[1,2,3]预测4,还是使用[1,2,3]预测4,使用[1,2]预测3,使用[1]预测2呢,谢谢

When I execute the final step, “python run.py --dataset foursquare --input_path foursquare-data --output_path output_data/foursquare --duplicate_removal --convert_inter”, the following error comes: File "/recbole/lib/python3.7/_strptime.py", line 326, in _strptime raise TypeError(msg.format(index, type(arg))) TypeError:...

question

你好,DIGINETICA 数据集在谷歌网盘中设置了权限,无法下载。这个问题是否可以更改下,谢谢

I followed the instructions on Readme.md to download and convert the movie lens dataset but I got the following error: **UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe9 in position 2892:...

能否提供下将数据集转换成kg文件的脚本?现在只提供了ml,amazonbooks和lfm的已经处理好的kg文件,但是缺少其他数据集

如果自己做的数据集类型是txt文本类型,怎么转换为原子文件呢?

我在使用 **python conversion_tools\run.py --dataset ml-1m --input_path ./ml-1m/ml-1m --output_path ./output/ml-1m --convert_inter --convert_item --convert_user** 这个命令得到.user文件后,发现文件中的age和gender列是错误的,如图, ![1706083844775](https://github.com/RUCAIBox/RecSysDatasets/assets/64204784/f13be434-2ae3-4102-9b16-59706443dd81) 我认为这段代码是错误的 ![1706083929716](https://github.com/RUCAIBox/RecSysDatasets/assets/64204784/02a4ff15-8645-4019-b1c8-05f403e7e68f) 或者有我没理解的深意呢