感谢!

AppsFlyer 推出空值建模功能,缓解广告主 iOS 侧空值焦虑

By Roi Tamir
空值建模

广告主如今最焦虑的事情是什么?

嗯,并不是 Covid,而是 Apple 难以捉摸的隐私阈值。

Apple 引入隐私阈值的目的,是严防识别唯一用户身份的行为。如果某广告活动达到一定的安装数量,Apple 就会判定其满足隐私阈值,将转化值通过 SKAdNetwork 框架回发给广告主;反之,转化值就会被屏蔽,显示为「null」,如下图所示红色字体一栏:

空值建模

虽然隐私阈值对维护隐私至关重要,但执行这项标准后,营销人员无从得知用户安装 App 后的事件、收入数据以及各渠道表现。收不到完整转化值的广告主只能获得安装数据,仅有这部分数据会导致 eCPA 和 ROAS 指标不准确,很难支撑有效的广告优化决策。

举个栗子。

渠道 A 获得的用户使用 App 更久,付费更多,更有可能成为高粘度用户,说明渠道 A 在引流活跃用户到 App 的表现优于渠道 B。

但是,渠道 A 的日安装率较低,可能无法满足苹果的隐私阈值。因此,SKAN 回传转化值为空的几率很大。

而渠道 B 日安装率很高,满足隐私阈值,空值较少或没有空值。

如果单就空值率来看,肯定觉得渠道 B 效果好,但如果要分析用户 App 内表现,可能会发现渠道 A 质量更高。因此,营销人员可能会选择渠道 B 优化,分配更多预算。这就是空值率高带来的决策失误。

看图说话:

2021 年 4 月 iOS14.5 正式上线,ATT 框架正式执行,空值占比约达到全部 CV 数据的 8%。同年 5 月,当 Apple 对隐私阈值算法进行修改时,空值率经历了一次急剧飙升,接着在 10 月再次出现飙升,随着数据降低又稳定下来。

换句话讲,无论广告主采取什么样的行动,空值率始终稳定在 11% 左右,只是偶尔会因为苹果的算法变化再次出现峰值。

虽然 11% 肯定比我们在 2021 年 10 月看到的 45% 的峰值要好得多,但对于营销人员来说,这仍然是一个相当大的数据缺失量;数据盲点只能寄托于猜测,营销人员感到挫折丛生。

简便易行的初始方案:

我们的研发团队花了几个月的时间来研究隐私阈值,并将空值作为工程团队深入研究 SKAN 机制的切入点。我们发现,空值是否被屏蔽这一决定发生于 App 激活当时,而不是安装后的用户活动。也就是说 Apple 算法在用户安装 App 时就决定了该 App 是否已经达到了隐私阈值。

如果我们假设回传出现空值的用户,与回传数据中不包含空值的用户的行为大致相同,营销人员就可以假设他们的行为模式是相似的

空值建模

举个栗子。

营销人员上线了一个广告,带来 100 次安装,其中 60 次未达到隐私阈值,包含空值。

剩下的 40 个安装返回了 1、3 和 5 的转化值。

为了对 1、3、5 转化值的计数进行建模,我们假设营销人员收到的 40 个安装的数据结果可以代表全部 100 个安装。

例如,40 次安装中有 10 次返回转化值 1,也就是说转化值为 1 的占比是四分之一,那么 100 次安装中就有 25 次返回的转化值为 1。这样就得出了一个推算后完整的转化值统计,也就是下方表格最右一栏展示的那样。

我们最初的构想简单易行,虽然有统计意义,但有两个主要缺点。

一是当 100% 的转化值都被屏蔽时,建模结果的转化值数量将为 0。
二是当空值占比很高时,模型所依据的极少部分数据就会建模得出一个过于失真的安装和事件数量。

显然,这种简单模型并不能解决实际问题,缺点太明显,未能提供真正的价值。

升级后的最终方案

于是我们的团队开发了一个更先进的机器学习模型:即便在广告组或广告系列的安装数量十分有限的条件下,这个先进的模型也能提供精确到广告组层级的数据结果。

这是通过贝叶斯分层技术实现的。我们运行统计测试,确保足够数据来估计整体水平分布(广告组、系列等)。如果广告组层级没有足够数据,我们就采用广告系列、媒体渠道甚至 App 等更高层级的数据分布。

空值建模

为了确保模型准确性,我们针对一个具有代表性的数据集上进行训练,并根据用于训练的同一数据集其中的一个子集进行验证。最后,还有一个单独的数据集,用来测试训练后的模型泛化能力。

最后,我们对模型进行广泛测试来评估准确性。最终,我们测试整个模型所依据的假设。

我们用一组不包含空值的转化值来测试数据集,首先我们主动屏蔽了数据集中的转化值,然后应用模型来填补出我们所屏蔽的转化值。然后,我们将算法模拟的转化值与我们早先屏蔽的转化值进行对比,并计算出差异。

结果表明,这个模型准确预测出了 88% 的缺失转化值。这个模型在测试时能够持续提供一致、准确的数据结果,今天,我们很高兴能与我们的客户分享这个业内首发的高阶数据建模。

成功数据建模,减轻广告主的空值压力

这项建模的成功之处在于它遵守了苹果的隐私保护措施,同时解决了营销人员的痛点。营销人员无需将用户层面数据分享给任一方,但却获得了汇总层级的数据结果,有效帮助营销人员做出更为明智的优化决策。

对缺失数据进行精确建模的好处是不言而喻的。不过,别忘了 AppsFlyer 的明星产品 SSOT (单一可信数据源)由此又补充了一个新的数据层。现在,营销人员不仅可以对安装和应用内事件进行去重,在 SKAN 回传空值的情况下也能够做到从容应对。从本质上讲,对转化值进行准确建模,为在 iOS 侧做优化的营销人员消除了第二大痛苦挑战。

参与 Beta 测试的客户在后台上看到了更准确的指标结果,在比较建模的收入和未建模的收入时,ROAS 平均提升了 15% 左右。

我们致力于为我们的客户提供有价值、有意义的解决方案, 确保隐私保护和精准衡量能够齐头并进。随着苹果公司不断为 SKAdNetwork 添加新功能,我们也将持续更新数据建模,基于先进的机器学习技术,为广告主提供全量数据的全貌。

Roi Tamir

Roi 在营销分析领域有近 10 年的经验,他能够很好的结合商业、营销和产品等领域的专业知识。目前,Roi 在 AppsFlyer iOS 侧产品解决方案。

Follow Roi Tamir

Background
准备好做出更佳决策了吗?