CEO 博客系列:打击欺诈、Google 搜索和机器学习
移动广告欺诈的影响范围和复杂程度正以惊人的速度增长,这比以往任何时候都危险。由于我们 AppsFlyer 一直以来都在与全球许多最大的广告客户开展合作,早在 2012 年便发现了最初形式的移动广告欺诈行为。这促使我们迅速推出相应的机制阻止这些早期欺诈行为:例如,自动拦截可疑的 IP 地址,并采用专有的客户端 SDK 身份验证。我们还与反欺诈公司联手,让客户能使用自己选择的工具。然而,我们很快便意识到,得益于我们的规模,实际上我们比同行业中任何其他的组织识别和阻止异常的速度都要快。
于我而言,这是有所成就的重要时机:数据不仅是新机会,还代表一切!数据代表机会、代表网络效应、而且是重要的市场准入壁垒。而最重要的是,公司可以为其客户提供其他公司所不能提供的价值。出色的技术只能让您做到这些,因为现如今,几乎可以相当容易地复刻任何技术。一旦推出出色的技术和客户喜爱的产品,您便可以进入下一个阶段:利用收集的数据和机器学习来改进技术和产品。而这正是平庸和非凡的明显分界线。
我们来看看 Google 搜索功能。索引技术已成熟,可以为很多公司(理论上讲是任何人)所用。那么为什么 15 年来 Google 在这方面都没有受到过挑战呢?答案很简单:数据!搜索引擎每天收集的数据都为其搜索算法提供支持。从技术上讲,正是我们,即用户,每天不断向 Google 提供数据。正是因为这些源源不断的数据,Google 才能提供卓越的搜索结果。理论上说,如果我们都停止使用 Google 搜索功能,转而使用其他提供商所提供的此功能,比如 Bing,那么不久之后它便会提供更好的搜索结果,而 Google 的搜索结果最终将变得无关紧要。
这正是我们使用 AppsFlyer Active Fraud Suite 和 DeviceRank 所做的工作。由于全球约 98% 的智能手机设备每月发生逾 5000 亿次移动交互,AppsFlyer 在移动广告方面投入的支出高达数十亿美元。平均来说,我们每天都与每台设备多次交互,且多次查看这些设备。因此,我们能够识别用户和广告网络级别的设备异常。例如,因为
(i) 用户不可能在一秒钟内点击多条广告,
(ii) 用户无法同时现身于全球若干个地点。
(iii) 即使我们确认了全球范围内 98% 的设备,一个广告系列根本不可能拥有 70% 的新设备。当这种情况发生时,百分之百就是欺诈。
就个人而言,我并不热衷于炒作。机器学习和人工智能现在绝对是大热门,但必须打破常规!如果不基于源源不断的海量数据进行训练,机器学习便毫无价值。因此,只有当您拥有强大的技术、出色的产品和海量数据时,您的产品才能够从实体发展为卓越。当您达到这样的境界时:您所提供的价值别人无法提供。
欺诈性产品就是 b#$ch,因为它主要由后端算法和机器学习组成,这使得它不那么明显。虽然我们的竞争对手正在努力赶超我们几年前就已经掌握和实施的工作,但我们在利用自身规模和数据方面遥遥领先。因此,我们的竞争对手正在加大营销投资,这在市场和广告商之间引起激烈竞争,而他们的欺诈工具则集中在基于规则的静态引擎上,并没有数据。就像 Bing。打击欺诈就好比猫鼠之间的较量。我们的规模使我们能够迅速地抓住这些欺诈者(老鼠),自动让我们的整个客户群免受欺诈。