Categories
程式開發

ClickHouse 在字节广告 DMP& CDP 的应用


业务背景

众所周知,广告是很多互联网公司的主要收入,对于字节跳动来说也是如此。那么,在字节跳动广告的 DMP&CDP 业务,乃至所有广告业务中,有哪些场景在使用 ClickHouse 呢?是在线服务还是离线统计的呢?应该说都有。

可以从三个场景来讲:人群预估、人群画像和统计分析。

人群预估 主要是根据一定的圈选条件,确认命中的用户数目。在广告精准投放过程中,广告主需要知道当前选定的人群组合中大概会有多少人,用于辅助判断投放情况进而确定投放预算。因为是在线业务,一般要求计算的时间不能超过 5 秒。

人群画像 主要是对广告投放的用户群进行画像分析,也是在线的,同样对时间有一定的要求,因为是偏分析的场景,一般不能超过 20 秒,否则用户的体验就非常差了。

统计分析 的使用场景比较多,在线、离线都有,包括一些搜索词统计分析,广告、投放收入数据的分析等等,应用的方面很多。

我今天主要分享的是人群预估,因为这是一个比较大的难点。而对于统计分析来说本身就是 ClickHouse 的强项。

就如我之前说的,人群预估就是根据一定的圈选条件,确认命中的用户数目。比如下图中我们可以看到,在投放广告的时候,可以根据地域、性别、年龄、兴趣、首次激活时间等条件进行圈选。其本质就是集合的快速交并补计算。

原文链接:【https://www.infoq.cn/article/lrVSgWF9WZNzLkLF8rop】。未经作者许可,禁止转载。