广告ROI高,一种是广告确实好,但还有另外一种可能...

深入浅出|带你剖析广告主视角下的互联网广告投放

刚入行的时候,我购买了市面上与互联网广告相关的书籍进行学习,发现多数内容都是媒体侧的,即媒体广告平台如何使用、媒体广告算法原理是啥,广告主侧的内容寥寥无几,原因之一可能是广告主侧本身也不那么open,所以互联网上的内容就比较少。

这篇文章就以我个人的理解,分享广告主侧在广告投放中的二三事,希望对大家有所帮助。(本文作者来源:贪玩游戏 二两)


广告主的困境

与媒体不同,广告主没有媒体那么多的数据,也没有媒体那么多的用户,我们只有自己产品的数据,这在业内称为后链路数据,这主要包括:激活、注册、付费、用户行为数据(不同行业可能不同),广告主要如何在有限的数据上玩出花样来?

此外,广告投放环境的变化,多数主流媒体(如:字节、腾讯、快手等)都要求广告主回传数据,即将部分后链路数据(如:激活、注册、付费)同步给媒体,其说法是,有了这些数据,媒体可以帮助你更好的获得用户,对广告主而言,就是将底裤都给媒体看了,不给还不行,你不给,其他广告主给,你的广告质量就差,所以行业内,大家几乎都给了,那我们如何破局获得相对优势呢?

现在媒体数据要的越来越多,国内媒体的广告创建相关的配置功能也在收窄,即往 Facebook 、 Google 上靠,渐渐的,可能会变成创建广告主上传素材后,你就做不了啥了,那广告主如何更好的利用素材呢?

下面围绕这几个问题聊聊。


投放数据的使用

首先,要聊的是,利用好前链路数据,即媒体侧提供的广告数据,主要是广告数值数据(广告曝光、广告消耗、广告素材观看数据等)和广告配置数据(广告出价、广告日预算、期望ROI、定向等),利用这些数据,你是可以训练模型的。

比如公司有几个很厉害的投手,你跟他们聊天,会获得比较模糊的描述,比如有些投手比较看重如何创建广告,有些投手比较看重广告消耗的过程,你难以总结出共性。

此时你可以整理出这些优秀投手对广告操作的历史数据,清洗出投手修改广告配置时的数据,即投手是看见了什么数据情况才决定修改某些广告配置的,构建出训练数据(典型的[data feature -> target]的结构),通过监督学习相关的算法,便可以训练出一个模型,这个模型在“看见”广告的某些数据情况时,就会做一些相应的操作。模型训练得好,广告效果不错的话,就有很高的商业价值。


数据修饰

因为媒体侧要求我们回传广告主后链路的数据,以帮助广告主获得更精准的流量(当然,这样媒体也可以比较清晰的知道每个广告主从自己的流量上赚了多少钱,从而卡你脖子)。

广告主本身也可以利用这点,具体而言,就是对数据进行修饰以获得相对优势。

展开来讲,比如大家都是游戏广告主,都通过广告买量获得用户,通常大家都会回传自己真实的数据,但你回传一些“参假数据”。参假并不是一定是欺骗媒体,避免它知道我们的真实收入(当然,也有广告主这样做),这里想强调的是另一点,即告诉它更多付费用户的数据,以期望在广告早期获得更多精准流量。


怎么做?

基于算法,利用游戏中用户的行为数据,可以做用户分类,判断出用户可能付费的概率,这样做的目的是,对于付费可能性较大的用户,虽然当前没有付费,我们也可以告诉媒体它付费了,这样媒体会推荐更多的精准量给我们。

相对于同行,大家游戏品质相似的情况下,因为用户付费行为是后置的,同行回传用户付费数据相比你晚,那么你的广告就有相对优势,这点在广告冷启动时,有所帮助,让你的广告在合理的用户人群下快速起量。

为了避免大家疑惑,我再话痨解释一嘴,这里所做的就是基于早期数据,分析出可以近似替代付费这一后置特征的新特征,如在某活动中活跃的用户,后续付费率高,利用可以早期获得的特征数据去对用户付费的回传数据做数据修饰,从而让广告有竞争优势。

这里你可能会遇到的具体问题是,直接使用原始的行为数据,量太大,对模型而言,噪音太多,所以你需要结合当前游戏,从业务上判断出多个关键节点,抽取出这些数据来分析。


素材的理解

个人认为,广告主对自身广告素材的理解程度是一个壁垒。首先,国内主流媒体往国外靠齐,想将广告投放中,大多数事情都自己包办了,那对广告主而言,对广告的可控性就变低了,现在我们还可以使用自己的定向包,设置广告定向,从而投放目标人群,后面可能就没有。

那什么永远不会被媒体做?当然是自己的广告素材,发展到后面,广告素材就要充当定向来使用了。

进一步讨论,对于广告素材,广告主能做什么?我认为可以做下面2点:

1、将素材从非结构化到数据结构化

比如图片、视频这类素材是非结构化的,程序很难处理,即意味着难以最大限度发挥素材的价值。

举个具体的例子,一个视频类素材的广告效果不错,常规做法就是使用不同账号通过相同的视频去创建广告,以期望获得更多流量。

这样做,你会遇到媒体素材疲劳度算法限制的问题以及吃尾量问题,所以更好的做法应该是,找到这个视频的“同类”视频,这就需要程序可以“理解”视频,但视频是非结构化数据,程序难以“理解”。

如何结构化?以视频为例,主要2种:


(1)业务方构建标签树,然后让人对视频打上标签,这个过程需要比较长的时间,但效果相对其他方法而言,比较可靠,就是需要人力的强介入。

这里强介入不只是单纯铺人,因为很多人对业务理解不深,此时打的标签就不太好,比如很多素材打上类似的标签,所以我们还需要业务人员介入去抽查,有了早期长时间积累的高质量标签数据,就可以做传统算法或半监督学习的处理了,这样一个视频通过标签树,便可以轻松找到具有类似标签树的其他视频。


(2)视频语音转文字,在对文字进行分词处理,从而获得视频与词的对应关系,后续找相似视频,就是NLP上词向量相似度的计算了,常用Word2Vec、FastText之类的算法(其实标签树本身也可以利用NLP相关的技术去处理)。

这里会遇到问题是,对于很多视频素材里出现的专用名字,比如游戏类视频会出现各种装备名词,语言模型识别准确率比较低,最终效果会比较差,要提高准确率还是需要人工介入提供先验数据。

当然,还有一种方法,就是对视频本身做处理,比如将视频看成连续图片,用深度学习相关模型对图片进行建模处理,获得可比较的特征值,利用这些特征来找相似的视频,具体可以通过 CNN + DNN 来实现。

这种方式我没有具体实操过,但个人认为单纯通过视频内容找相似的方式不太可行,原因是这种方式与目前短视频平台判断某视频是否抄袭原理类似,而广告层面,也是使用相似技术判断投放素材疲劳度的,你通过算法找到画面上相似的新素材,虽然是不同的素材,但媒体广告查重算法也会将它认为是相同素材。

而上面讨论的,基于标签树与视频语音的方式做结构化再找相似度,其实是希望找到内容上趋近,而不是“画面”上趋近的视频素材。


2、利用用户行为数据配合运营活动生成素材

比如一款游戏,在游戏中有不同的活动,在不同活动中,玩家质量是不同的,比如,某个副本活动,付费玩家比较多,那就可以以副本活动为素材,多创建一些广告,这便是利用用户在产品中的行为数据配合上产生这些行为的具体场景去生成广告素材,进行AB测试后,便可放大这类广告了。

企业内部还可以将这个过程自动化,即基于统计学中一些算法,对过去几天不同活动中玩家付费情况做分析,然后将结果给到素材组制作素材。


结合多个媒体与借力媒体

结合多个媒体,就如其字面意思,大的广告主会投市面上所有的主流媒体,此时可以结合广告主自己的后链路数据,对不同媒体在下一个小时买量策略进行调整。

比如,我从头条、腾讯、阿里都投了广告,用户过来后,可以拿到用户行为数据,基于对用户行为数据的分析,判断不同媒体过来用户质量的高低,不同媒体在同一时刻下,过来的用户质量是有差异的,比如这一小时内容,头条过来的用户,从用户行为上看,质量比较高,那么下一小时,在头条上投更多广告,在腾讯与阿里上投少一点,做到总消耗固定的前提下,尽量拿到高质量的流量。

这个思路也可以放在时间维度上,哪个时间段广告效果比较好,明天相同时间段前2小时创建多一点广告(留2小时让广告过审核),这块可以使用PID算法去做广告成本的动态控制。

接着再谈谈借力媒体,每个主流媒体都是庞然大物,曾经跟阿里的工程师聊天,其称国内互联网中,90%(比90%多,具体多少忘了)的用户在阿里这里都有相应的特征,这些数据其实可以赋能于广告主,具体就是做lookalike,找到对广告主而言高价值但广告主目前流量池中没有的用户,当然这个功能是要花钱的。


从媒体侧去思考广告主侧

媒体侧的广告算法相对而言是比较透明的,这里的透明不是指媒体侧广告算法是公开的,相反,这一直是黑盒,大家也都是在猜。

我之所以说比较透明是其技术原理的透明,比如刘鹏老师《计算广告》的书籍就介绍了很多,此外,媒体侧的广告算法几乎与推荐系统脱不开关系,而推荐系统知名算法、原理都是公开的,媒体侧商业算法难以对其从根本上修改,那么熟悉媒体侧的算法,其实有利与广告主对自己创建广告的理解,通过逆向思维去思考,自己要怎么样去创建广告,才能迎合媒体的算法。

还是举一个具体的例子,我们创建广告时,不同的广告账户通常只创建某个具体版位的广告,如账户 A 只投腾讯朋友圈的广告,账户 B 只投优量汇的广告,其背后的考虑就是方便媒体算法对广告账户建模,通常而言,账户数据单一一些,算法可以更容易从中提取出特征,再进行建模。


一个误区

文章的结尾,聊一个误区,这也是我刚入行是犯的。

看很多文章,大家都会强调ROI,只要ROI为正的,就可以去无限放大,但这个观点在广告投放中可能是错的,如果你这样投放广告,效果会很惨烈。

广告的 ROI = 付费(广告带来的收入)/ 消耗(广告花了多少钱)

如果广告ROI高,可能是广告确实好,但还有另外一种可能,就是你这条广告撞到大R(高付费用户),这个大R将你广告ROI的分子拉高,但如果你广告的付费率(付费人数/注册人数)比较低,你广告定向的人群可能是有问题的,大R只是你运气好,后续你放大广告,就会发现,下个大R遥遥无期。

所以一个好广告,要看多个复合指标,比如要同时看消耗、ROI、付费率等,而不能只看单个指标,关于各种复合指标,我个人比较推荐的做法是参考各种成熟的公式,还是以消耗、ROI、付费率为例,如果只是单纯的(消耗 * ROI * 付费率)这样构建出复合指标,会因为消耗数值比ROI、付费率大很多,而导致权重问题,那怎么设计呢?

简单琢磨,好广告,我们希望消耗、ROI、付费率都越高越高,会比较好,这就可以利用机器学习中用于判断分类模型优劣的F值来做复合公式:


简单而言,模型的精确度和召回都大,F 值才大,任意一项小,则F值会小,将其简化一下,将 β 设置为1,获得 F1 的值,变化一下公式,如下:


将消耗、ROI、付费率替换上去,就得到了一个符合业务且在其他领域进过千锤百炼的复合公式了。


题外话,算法工程师还是要多练基本功,不要因行业的开放性,天天拿开源模型来唬人。

返回全部