MovieRecommend
MovieRecommend copied to clipboard
关于逻辑回归算法里用户的职业这一特征
if occ in occupation2Id.keys(): # 如果在其中 occ = occupation2Id.get(occ) # else: # 否则,重新生成一个值 occupation2Id[occ] = len(occupation2Id) # 构建一个occupation -> id 的字典 occ = len(occupation2Id) - 1 # 一个新的职业
1、这里为何是 -1 ,而不是直接 occ = len(occupation2Id)
2、电影类型已经ont-hot编码了,职业种类也应该ont-hot编码
- 是len(occupation2Id)-1而不是len(occupation2Id)是因为我的occ是从0开始计算的。【也就是occ=0也算是一种职业映射号】 2.关于第二点,这个看法应该是可以尝试的,但我还不知道效果是否更优? 如果你能给出具体的例子或者说明就更好啦~