感谢!

聊聊数据差异那些事儿

By Linda Lin
数据差异

摘要:不同的第三方数据追踪平台数据有差异?别慌,可能是对比方式出现了问题!就让AppsFlyer帮你一起找到原因吧!

作为全球领先的移动归因与市场分析公司的一员(说到这里自豪自豪的),常常接到小伙伴们咨询:为什么同样一个App,这个平台和那个平台的数据对不上?

首先,作为两个不同的系统,如果他们承担的职能和角色不同,拥有的数据信息不同,逻辑或设计不同,都会导致数据差异。所以一定范围内的差异是正常的正常的正常的(重要的事情说三遍)!

什么?你说知道数据会有不同,但差异惊人?!

Wait~在正式进行调查之前,检查以下几点,你会发现说不定只是对比方式出了Bug

1. 日期不同

确保两边数据的样本周期是完全一致的,这不单单指选择的日期范围需要一致,还要注意该日期范围内收集的数据是否完整。

举栗子:有的客户先在Facebook上推广App获得流量,推广一段时间后,才关联AppsFlyer,那么AppsFlyer的数据与Facebook相比本身就是不完整的,缺失了几天的数据,必然会出现差异。

2. 数据缺失

对比数据时要确保两边的数据没有缺失。

举栗子:客户在推广平台上往往会使用多个账户投放,在统计数据时可能会遗漏个别投放账户,从而导致差异。

3. 时区差异

不同系统可能会使用完全不同的时区,所以尽量选择更长的时间范围(3到7天),来抵消时区造成的差异。

4. 历史样本库差异

我们知道,各个系统能获取到的用户数据是不同的,比如Facebook,Google做归因只以自己系统的用户库来进行排重处理,那么一个Facebook的老用户,点击Google广告后产生的再次安装,必然会被Google计算为新安装,但使用AppsFlyer可以汇集各个平台的数据,那么在全平台的排重规则下,再次安装是不会计算为新安装的。

与这个逻辑相关的极端情况是,App本身已经积累了不少老用户,在新版本才集成AF SDK,如果没有采取用户录入,那么老用户的更新会被AF计算为新用户。

5. 数据来源差异

以session举例,客户自己BI很有可能是通过用户登陆,或是通过服务器收到客户端发送的某个或多个活动来计算一次session等等,都可能与AppsFlyer的打开事件完全不同。

也常会有客户集成了某些其他广告追踪的SDK,但初始化位置与AppsFlyer SDK不同,造成比较大的数据差异。

所以合理的数据对比需要建立在双方的计算逻辑完全清楚的基础之上。

6. 样本库差异

举栗子:应用商店数据并不包含apk下载量,或对比时两边包含的app版本不同,都可能会造成比较大的差异。

7. Human error或工具显示问题

进行人工导出或分析数据时,要小心使用的工具给你设下陷阱。

常见的一个问题是,用Excel打开csv报表时,由于字符集不对导致显示数据串列,统计出的数据自然有问题。

8. 报表filter条件差异

使用后台查看数据时,留意filter方面的默认设置。

比如为了有效展示留存数据,AppsFlyer retention报表的最小分组量(Min Cohort Size)默认是10,那么计数小于10的分组将不会显示出来,这就会导致客户发现利用retention查看install数据时比会其他报表少,或是不同分组设置的install数据不一致。其实这是filter不同造成的, 解决这个问题只需要将Min Cohort Size改成1即可。同样的,其他系统也可能存在其他的filter设计,需要特别留意。

9. 报表逻辑差异

不同的报表是为不同的分析目的而服务的,背后的计算逻辑可能完全不同。比如AppsFlyer的面板基本都是LTV(生命周期)数据,为方便客户分析某天投放带来用户的后续质量,进而优化广告效果。而下载原始数据/Activity报表才是当天发生的数据。我们常常遇到客户将AppsFlyer的LTV数据与他们自己后台的Activity数据进行对比,差异可想而知。

10. 安装定义差异

我们知道AppsFlyer的安装指的是首次打开(First open),而商店安装实际上是下载。这两者之间会有一定的差异。

比较tricky的情况是, Google AdWords平台上的转化(conversions)概念本身比较复杂,客户在AdWords查看的conversions download 数据,可能来自不同的conversion source,比如来自Google Play的下载,或是Firebase的first open等信息,但客户以为其采用的是AppsFlyer的数据,看起来差异就会非常大了。

所以,进行AdWords的数据对比时一定要选择查看conversion name,只选取AppsFlyer的first open数据来对比。

11.归因窗口期差异

熟悉我们的客户一定知道归因回看窗口期即lookback window问题已经是屡见不鲜了,归因窗口期将客户从点击/查看广告到下载打开应用的时间定义为有效期。而实际上我们发现有一定比例的用户是操作广告后过几天才打开应用的。当涉及查看归因view through时差异会尤其明显。比如Twitter/Facebook上View Through如果是开启状态,而AppsFlyer上是关闭状态,那么可能造成比较大的差异。

说了这么多,出现差异怎么办?来来来敲黑板划重点!

  1. 将数据以不同维度划分进行对比
    试着将数据按天/campaign/App version来对比,可以很容易发现差异问题的具体原因以及数据缺失等问题。
  2. 参考以上差异原因逐一排查
  3. 上传完整信息到AppsFlyer Support调查

实在没有头绪?没关系,将你的问题交给我们!提供App信息,账户邮箱,AppsFlyer数据的截图,以及对比数据的完整信息,包括该平台的计算逻辑,数据来源,时区,归因窗口,日期范围,相关设置截屏,click & install数据截图等到大中华区Support团队,我们会帮您解决!

Linda Lin

Linda 是 AppsFlyer 亚太区技术支持团队负责人。
Background
准备好做出更佳决策了吗?