广告行业(Advertising)都有哪些数据科学应用?

广告行业(Advertising)都有哪些数据科学应用?

你可能听别人说过Facebook(Meta)或Google的数据是如何驱动广告植入的,这里所说的数据驱动广告指的是广告供应商向可能对广告内容感兴趣的消费者提供更高比例广告的能力。但是,除了大型科技公司复杂的广告投放数据驱动系统之外,还有一个更密集的广告领域数据驱动业务群体:广告代理公司。与大型科技公司的方式不同,目的也不同,这些机构会利用数据进行一项非常重要的操作:预算分配(通常受到行业外的监督)

从更高的层面上讲,你可以把广告机构想象成为客户管理和执行广告活动生命周期的公司。这些生命周期包括了内容创建、营销策略设计、与广告供应商的点对点联系、集中账户管理、当然还有数据分析。如果你想了解更多数据分析相关内容,可以阅读以下这些文章:
广告行业转行数据分析——Data Science在Digital Ads行业的求职与应用有哪些?
谷歌居然不再发送定向广告?其中的隐情居然是。。。
手游vs网游!游戏行业如何通过数据分析让你上头?
元宇宙(Metaverse)揭秘——数据科学将如何应用在元宇宙?

通过持续地评估绩效vs.成本、感觉vs.年龄性别、转化率vs.媒体类型等指标,广告机构可以决定如何动态分配活动资源,从而满足客户的目标。

在今天的市场中,品牌的认知度和表现是最重要的目标,这些客户的目标也定义了活动的目标,从而为相关分析提供了重要的数据。把广告想象成一场活动的一个单元,一次活动的广告通常会在不同类型的媒体上运行,而每种媒体可能有不同的目标,加在一起,它们构成了活动的整体意图。例如,广告活动中的广告可能目的是提高知名度,这意味着它想让公众了解所呈现的产品/服务,因此我们关心它的覆盖范围、印象、和受众统计数据(如年龄和性别)。而有一些广告的最终目的,是将受众导向他们可以购买产品、或注册服务的地方。在这种情况下,需要通过点击或点击率等指标分析,并跟踪转化率和流量。

图片来源于作者

广告公司在各种各样的媒体类型上进行宣传,包括数字、电影、广播、电视、媒体和ooh(out of home户外)数据科学家们设计数据分析解决方案,能够从不断变化的数据中提取并提供有意义的见解。这些见解是为了支持活动生命周期中的关键业务决策,让客户了解他们目前活动的各种关键统计数据。

比如:

  • 我们在电视上花了很多钱推广,但没得到预期的结果,所以要限制一些预算。
  • “Facebook(Meta)”供应商有我们超过40%的数字产品,难道就没有其他供应商吗?“Instagram”呢?

数据分析解决方案会接收、处理和分析数据,最终在数据可视化工具(如DOMO、亚马逊Quicksight或Power BI)上以可视化、自动化的方式,按计划在一段时间内(根据客户预算的大小而定)提供分析的见解。由于开展活动的媒体类型不同,接收原始数据的渠道和数据类型也会有所区别。

数字Digital

数字是指在互联网上的所有内容。如Facebook(Meta)广告、谷歌广告、YouTube广告、任何其他门户网站的广告,通常会由Teads这样的主要供应商提供。这些公司主要是科技公司,他们会公开一个API来提取活动的非关系性统计数据,甚至还会有一些最流行的编程语言的库。

电影Cinema

每部电影前会播放 15 分钟的广告,它们加起来就是客户的终端数字。你可能也注意到,电影院里的广告内容标准比普通广告更高。代理商会得出每个电影广告活动的印象数(impressions),相关的文件主要是由客户管理人负责。

根据代理商的规模,他们可以通过已知的印象数来了解广告的覆盖范围,电影公司也可能会以他们的销售数据库的记录作为参考。

电视TV

电视的广告形式和电影差不多。在这里,投放范围需要由供应商部分(电视公司)来填写。电视公司每周7天24小时地收集他们的覆盖数据,因此他们需要向代理机构提交这些数据。

广播、新闻和户外媒体
(Radio, Press and OOH)

代理机构需要收集原始数据,如计划预算、花费预算、印象数、覆盖面、点击次数、供应商、受众人口统计数据,以及在活动生命周期中以增量模式持续的转换率。数据分析必须足够复杂,以分析跨不同数据集的公共数据字段的数据。

解决方案

从数据工程的角度来看,我们希望所有这些数据以自动化的方式及时收集到对象存储中(如AWS S3、Microsoft Azure存储帐户或GCP云存储)

对于API,我们可以使用一个脚本,将请求按时发送到供应商端点,并将响应对象推送到我们的云对象存储服务。我在工作中会使用无服务器架构,如AWS Lambda, Azure函数或GCP云函数。

因为其余的数据需要由帐户管理或第三方提供给我们,所以我们需要一种方式让他们访问我们的对象存储。我们可以用一个SFTP服务器连接到我们的存储,这样,每次服务器接收到一个文件时,它都会映射到对象存储文件夹的对象中。

在我们连接了所有这些数据源之后,就代表数据摄取的过程完成了,对象存储会不断地从解决方案需要处理的所有数据中获取数据。这也被称为数据湖(Data Lake)

图片来源于作者

其余的过程就是一些ETL作业和脚本,将所有数据转换为有意义的形状进行分析,包括字段重命名、数据类型分配、正则表达式、复杂的join操作,以及将文件格式转换为更容易分析的格式,如Parquet/ORC。这些操作都在工具框架中进行,如Hadoop、Spark或云管理解决方案,如AWS Glue、Microsoft Azure Data Factory或GCP Dataproc。你也可以使用开源的库,比如pandas for python。作业和脚本既可以通过事件触发器(event triggers)运行,也可以按时间计划运行。

最后,解决方案还需要将转换后的数据存储到另一个云对象存储中,或者更好的一个选择是存储在云托管的数据仓库中,如Amazon Redshift、Microsoft Azure Synapse或GCP Big Query。

广告代理商将根据这些数据提供他们所选择的数据可视化工具,而商业智能部门就会处理最终的仪表盘/可视化设计。当有新的原始数据时,解决方案都会自动更新最终的数据集。然后,客户管理人员会与客户进行跟踪会议,一般围绕着可视化图表进行,几乎每天都会动态分配数千美元,并且很大程度的依赖于数据分析。

数据分析带给营销领域的好处已经被人们广泛认同。通过这篇文章,你了解了广告的不同类别和数据解决方案,感谢你的阅读!你还可以订阅我们的YouTube频道,观看大量数据科学相关公开课:https://www.youtube.com/channel/UCa8NLpvi70mHVsW4J_x9OeQ;在LinkedIn上关注我们,扩展你的人际网络!https://www.linkedin.com/company/dataapplab/

原文作者:Aram Maliachi
翻译作者:过儿
美工编辑:过儿
校对审稿:Jiawei Tong
原文链接:https://towardsdatascience.com/data-science-within-the-advertising-industry-469c4d728635