SparkCTR
SparkCTR copied to clipboard
CTR prediction model based on spark(LR, GBDT, DNN)
`val instr = Instrumentation.create(this, oldDataset) instr.logParams(params: _*) instr.logNumFeatures(numFeatures) instr.logNumClasses(2)` spark 2.3.2,官方文档地址:http://spark.apache.org/docs/2.3.2/api/scala/index.html,并没有这几个类可以用
比如有user有1000W,item有1000W,那么要有 1000W*1000W = 1000000亿 的特征数据?
Parameter Server架构还是All Reduce架构? CPU还是GPU? 有没有开源代码参考? 用不用改TensorFlow源码? 性价比最高的方案是?
非常感谢如此全面而具体的实现,我在idea导入项目并安装完成依赖之后运行modelselectionExample显示如下错误,请问是什么问题 ``` 错误: 找不到或无法加载主类 com.ggstar.example.ModelSelection 原因: java.lang.ClassNotFoundException: com.ggstar.example.ModelSelection Process finished with exit code 1 ```
您好,请问能提供一下samples.snappy.orc文件吗,谢谢!
从您公众号来,测试数据有吗?
测试数据
请问测试数据是哪一份,之前没有搞过ctr,不知道对应什么经典数据集?