前言
本博客是学习记录,可能存在错误,仅供参考。
如发现错误,欢迎在评论区指正,我会及时修改。
同时也希望大家能在评论区多和我讨论,或者私信我,讨论可以让我们学习效率更高。
现在的版本不是最终版本,我会在学习过程中不断地更新。
第3章 用户行为日志
3.1 用户行为日志概述
埋点:是收集用户的各项行为信息以及行为所处的环境信息的手段
分类如下:
****代码埋点****是通过调用埋点SDK函数,在需要埋点的业务逻辑功能位置调用接口,上报埋点数据。例如,我们对页面中的某个按钮埋点后,当这个按钮被点击时,可以在这个按钮对应的 OnClick 函数里面调用SDK提供的数据发送接口,来发送数据。(此方法已经基本被淘汰)
****可视化埋点****只需要研发人员集成采集 SDK,不需要写埋点代码,业务人员就可以通过访问分析平台的“圈选”功能,来“圈”出需要对用户行为进行捕捉的控件,并对该事件进行命名。圈选完毕后,这些配置会同步到各个用户的终端上,由采集 SDK 按照圈选的配置自动进行用户行为数据的采集和发送。(此方法更加简单操作,但也用的不多)
****全埋点****是通过在产品中嵌入SDK,前端自动采集页面上的全部用户行为事件,上报埋点数据,相当于做了一个统一的埋点。然后再通过界面配置哪些数据需要在系统里面进行分析。(小公司可能使用第三方埋点,但会造成数据泄露,大公司基本自己开发)
3.2 用户行为日志内容
本项目收集和分析的用户行为信息主要有页面浏览记录、动作记录、曝光记录、启动记录和错误记录。
3.2.1 页面浏览记录
3.2.2 动作记录
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-6evbfgy2-1666278791053)(离线数仓-用户行为采集平台.assets/image-20221017154728629.png)]
3.2.3 曝光记录
曝光是指该页面展示过了哪些信息,例如轮播图,有的图可能还没有轮播到,页面就关了。
3.2.4 启动记录
3.2.5 错误记录
例如404,500这些错误,记录下来,排查是用户的问题,还是应用的问题。
3.3 用户行为日志格式
日志结构大致可分为两类,一是页面日志,二是启动日志。
每个类别中都用Json的文件格式记录日志,对于重复的信息,会共用一个。
3.4 服务器和JDK准备
有的内容在之前的组件中已经学习过了,此处省略
3.4.6 环境变量配置说明
这两种shell的主要区别在于,它们启动时会加载不同的配置文件,login shell启动时会加载/etc/profile,/.bash_profile,/.bashrc。non-login shell启动时会加载~/.bashrc。
而在加载/.bashrc(实际是/.bashrc中加载的/etc/bashrc)或/etc/profile时,都会执行如下代码片段,
因此将环境变量配置到/etc/profile.d/*.sh下,在登录Shell和非登录Shell下能有加载到。
3.5 模拟数据
见文档