DeepMatch-Torch
DeepMatch-Torch copied to clipboard
「PyTorch」A deep matching model library for recommendations & advertising. It's easy to train models and to export representation vectors which can be used for ANN search.
There are two bugs related to the codes for YoutubeDNN model. 1. The gen_data_set_youteube has a typo... should be youtube. (Not necessarily a bug lol) 2. Here's the *first* bug:...
### Discussed in https://github.com/bbruceyuan/DeepMatch-Torch/discussions/4 Originally posted by **xbingsun** May 25, 2022 您好,我在mind实现代码中看到调用 input_from_feature_columns 函数得到用户的历史行为的表示,而在该函数中使用了get_varlen_pooling_list对用户的行为进行了pooling操作,想要请问这样做的原因是什么呢?好像原版本的deepmatch中也使用了这个操作,根据原论文胶囊层输入应该是各个items的embeddings(如下图)。
在run_youtubednn.py中,`SEQ_LEN = 50`,但是在创建`user_feature_columns`这一个变量的时候,声明的历史电影长度为10,这会影响模型的正确运行么? `VarLenSparseFeat(SparseFeat('hist_movie_id', vocabulary_size=feature_max_idx['movie_id'], embedding_dim=embedding_dim, embedding_name="movie_id"), maxlen=10, combiner='mean')` 在创建item tower的时候,X维度为(BatchSize,61) (1+1+1+1+1+50+6=61),当取item的id的时候,`self.feature_index['movie_id']`为[15:21],这会导致不能正确地按照维度取值? data:image/s3,"s3://crabby-images/0610a/0610ae6f699420eb0e02a326f9a43036b5a8efb8" alt="image"