detectivelcy
detectivelcy
【场景】 行业原因,车开进地库了,就没有4G信号了,然后车主可能一周后再出车,此时数据才上来。导致app数据采集可能会存在数据上报延,数据会存在两个时间,数据生成的时间、服务器收到的时间。我们在建立ODS的时候,表的分区一般会采用天来做分区。 【目前想到的解决方案】 无论按服务器时间还是数据生成时间,因为dw是定期执行的,数据延迟到达的话无论如何都无法避免。此时只能针对特定业务来处理,和业务确认一个合理的最大延迟时间。超过最大延迟的丢弃。合理时间内的dw按数据生成时间来做,然后某些在dw上汇总统计操作再定期重跑。
【场景】 1、多端识别方面,比如顾客通过网页SEM下载了APP,然后在APP内购物,计算ROI的时候肯定要算到这个SEM里面的,所以需要识别客户。 2、同一个用户,如果通过SEM访问后,再注册登陆,下载APP,如何识别到是同一个用户并且归功于哪个SEM? 3、SEM会有个有统计代码的链接,通过那个链接下载的就是那个渠道引流的用户,但是WAP和APP依旧不是同一个ID,通常是怎么处理的呢?
【场景】我手机上用某一个app,这个app上我做了一套用户行为埋点。那么我肯定不希望我操作这个app的时候这些数据信息随时同步到这个app的后台,因为我要花流量费。而上传信息对我本人来说没有什么效益。但是这部分我不清楚会耗费多少流量。那用户万一清理手机了呢,是不是行为信息就没了?那如果不是实时上传,就是检测到wifi环境上传。
【背景】我们现在遇到的一个问题是。运营部门或者产品部门,上一个新功能或者新页面或者新活动的时候,需要很久才能看到这一块的数据,因为要上新页面/新功能/新活动,要联系客户端开发,数据分析,大数据开发,数据产品,协调埋点,数据统计,上报,展示等环节,周期时间比较长而且有时候还容易出错。 【需求】目前就是想着能不能有一个快速的方法将这个问题解决掉,当一个新页面上去之后迅速就能看到这个页面的数据。 【目前想到的方案】 目前我能想到的一个解决方案就是:做一套埋点系统,将所有的埋点都以变量的形式放在一个大的查询当中,每天晚上去跑这个查询,将查询的结果展现在页面上或者报表上,实现自动化。