paint-brush
广告商如何在儿童视频中使用基于展示位置的定位经过@webtwo
265 讀數

广告商如何在儿童视频中使用基于展示位置的定位

经过 WebTwo14m2024/06/25
Read on Terminal Reader

太長; 讀書

本文深入探讨了广告商如何通过 YouTube 上的展示位置广告定位儿童,详细介绍了广告收集方法、广告分类以及 Google 提供的广告解释的复杂性。
featured image - 广告商如何在儿童视频中使用基于展示位置的定位
WebTwo HackerNoon profile picture
0-item

作者:

(1)Tinhinane Medjkoune,格勒诺布尔阿尔卑斯大学,法国国家科研中心,格勒诺布尔 INP,LIG 法国;

(2)Oana Goga,法国 LIX、CNRS、Inria、巴黎综合理工学院、巴黎综合理工学院;

(3)Juliette Senechal,里尔大学,CRDP,法国DReDIS-IRJS。

链接表

摘要和引言

背景

儿童广告法

针对儿童的机制

使用基于展示位置的定位

限制

相关作品

结论、致谢和参考文献

附录

5 基于展示位置的定位的使用

本节提出了一种测量方法来调查广告商是否在利用基于展示位置的定位来向儿童宣传他们的产品。

5.1 数据收集方法

我们的方法基于浏览器扩展程序,该扩展程序可以捕获用户观看 YouTube 视频时显示的广告信息。从高层次来看,测量方法包括指示六个浏览器配置文件观看以儿童为中心的视频并收集显示的广告。


广告捕获工具。每次向用户展示广告时,DOM 都会更新,以将新元素添加到所观看视频的 HTML 代码中。因此,为了捕获广告,我们的浏览器扩展程序只需监控 DOM 的变化即可。我们的扩展程序适用于 Chrome,可以捕获视频广告(在观看视频的开头、中间或结尾处启动的视频广告)和浮动卡片广告(包含图像、GIF 或文本的广告,在导航栏上方观看视频时显示)。当我们的浏览器扩展程序检测到广告时,它会收集以下信息(主要是文本):


• 广告数据:广告商名称、广告商的 YouTube 频道、广告商的链接、浮动广告的图片或 GIF、视频广告的广告 URL。


• 视频观看数据:我们收集所观看视频的标题(出现广告的视频)、其URL、其描述、观看次数、视频发布日期、对应频道以及频道关注者数量。


• YouTube Kids 重定向:如果 YouTube 建议将用户重定向到 YouTube Kids(这意味着视频在 YouTube Kids 上 - 参见附录中的图 2),我们会收集信息。


• 广告说明:浏览器扩展程序会收集“我为什么会看到这个广告?”功能中显示的数据。点击广告视频左下角的按钮 ○i 即可访问此功能。系统会打开一个模式,并向用户描述向他们展示广告的原因。我们通过模拟点击按钮来收集这些信息,从而恢复点击后发送的请求的响应。要关闭模式,我们会在模式窗口外模拟另一次点击。


表 2:我们的浏览器配置文件的特征。


我们不会收集观看视频的个人资料/身份信息(每个用户都与浏览器扩展程序生成的唯一标识符相关联)。这些数据通过安全的 HTTPS 连接发送并存储在我们的实验室服务器中。存储服务器受防火墙保护。


角色。当有人在 YouTube 上观看视频时显示的广告可能取决于浏览器配置文件(由浏览器中跟踪以前访问过的网站的 cookie 确定)和用户登录时的 Google 配置文件。因此,为了有更广泛的视角并解释浏览器配置文件如何影响结果,我们创建了六个具有不同参数的浏览配置文件——见表 2。


我们创建了:(1)两个浏览器配置文件,没有关联的 Google 配置文件,也没有浏览历史记录。(2)两个配置文件与一个空的 Google 配置文件相关联,该配置文件没有性别规范,也没有浏览历史记录(配置文件仅设置了年龄,因为用户必须指定出生日期才能创建 Google 帐户)。(3)两个配置文件与 Google 帐户和浏览历史记录相关联。一个帐户的性别设置为女性,另一个设置为男性。对于女性配置文件,我们访问了四个与服装、猫粮、大众汽车和法国动物权利相关的网站;对于男性配置文件,我们访问了一个与整形手术相关的网站。对于 P3-P6,我们检查了 Google 广告设置页面,以调查 Google 对不同配置文件推断的兴趣 [34]。正如预期的那样,P3 和 P4 没有任何兴趣。P5 配置文件的兴趣包括时尚与潮流、宠物和汽车与车辆,P6 的兴趣包括身体护理与健身。这些兴趣与查阅的网站一致。


Google 不允许儿童(未满 18 岁)创建 Google 个人资料。我们之所以选择个人资料,是因为 Google 为儿童观看 YouTube 视频提供了多种可能性:(1) 儿童可以使用不与任何个人资料关联的隐身浏览器;(2) 儿童可以创建年龄错误的帐户;或者 (3) 儿童可以使用其父母之一的帐户,而父母可能已经在网站和应用程序上使用过此帐户,因此浏览历史记录已经存在。


仪器仪表。我们于 2022 年 4 月 28 日至 2022 年 5 月 5 日期间在 YouTube 上进行了数据收集。我们在两台不同的计算机上同时从六个配置文件中收集数据。我们通过创建六个 Selenium 会话同时启动六个角色。角色浏览三个列表中每个频道中最近的十个视频:儿童 YTB 儿童列表、儿童种子列表和成人列表。每个视频都从头到尾观看。借助扩展程序,每个投放的广告都会被收集并存储在我们的服务器上。我们的停止点是整个 YouTube 频道列表的末尾——620 个视频。表 3 显示了我们为每个列表和每个配置文件收集的视频和浮动卡广告数量。在六个配置文件中,我们收集了 3,221 个广告。


表 3:不同配置文件收到的广告数量。


实验难点说明:数据收集非常耗时:(1)我们需要观看视频直到结束才能捕捉到所有广告,因为广告可以在视频播放过程中的随机时间出现,并且视频中出现的广告数量没有固定的。视频的长度从不到 2 分钟到超过 1 小时不等。(2)我们模拟双击以恢复“我为什么会看到这个广告?”中的信息有时会触发一个不会关闭的模式,从而中断视频的进度,因此需要人工干预来关闭模式并重新启动视频。这限制了实验的规模。尽管如此,由于本文关注的是广告商是否使用基于展示位置的广告来定位儿童,而不是提供针对儿童的视频上显示的广告的代表性特征,我们认为使用六个浏览器配置文件进行检测就足够了。

5.2 基于展示位置的定位检测

广告在视频上显示的原因取决于广告商设置的定位参数和平台投放广告的算法。在本文中,我们专注于基于展示位置的广告。因此,给定一组在视频上显示的广告,挑战在于区分针对视频的广告(即基于展示位置的广告)和由于其他原因(例如基于兴趣、重新定位)而显示的广告。


我们的第一个想法是使用多个浏览器配置文件同时观看同一个视频,并且仅将出现在所有配置文件中的广告视为基于展示位置的广告。在我们从六个配置文件中收集的 668 条独特广告中,只有两条广告被所有六个配置文件接收。作为参考,有 39 条广告被四个或更多配置文件接收,有 128 条广告被两个或更多配置文件接收。然而,这种方法不幸地存在误报(广告出现在所有配置文件中,因为广告商发起了一场非常大的广告活动并且出价高于竞争对手)和漏报(广告可能是基于展示位置的,但由于预算限制和竞争,广告不会出现在所有视频中)。因此,这种方法无法提供可靠的基本事实。


幸运的是,Google 在“您为什么会看到此广告”功能中为用户提供了他们收到特定广告的原因解释(请参阅第 2 部分)。因此,我们决定调查这些解释是否足够精确,以帮助我们区分基于展示位置的广告和其他广告。我们的 Chrome 扩展程序能够收集我们收集的所有广告的“您为什么会看到此广告”按钮中的信息。表 4 显示了 Google 提供的不同解释。请注意,我们的研究是用法语进行的,因此表中的原因是法语翻译而来的,在英语中的语法可能略有不同。我们将这些原因分为八大类定位:P — 基于展示位置的广告;R — 重新定位广告;T — 基于主题的广告;K — 基于关键字;I — 基于身份;B — 基于行为或兴趣;L — 基于位置;G — 一般定位。不同的广告说明涵盖了 Google 提供的不同定位类型,提供的说明非常精确,例如“您正在浏览的网站上的主题”或“Google 对您的房屋入住状况的估计”。对我们来说更有趣的是,EID 1 的解释“您正在观看的视频”似乎对应于基于展示位置的广告。另一个有趣的解释是 EID 27,“此帐户或内容已禁用广告个性化。因此,此广告不是根据您的数据个性化的。”因为它明确指出广告不是个性化的。这很有趣,因为谷歌声称不会在以儿童为中心的视频上投放个性化广告 [63, 64]。


验证。先前的研究表明,Facebook 上的广告解释不完整且具有误导性 [4]。虽然对 YouTube 上的广告解释进行全面审核超出了本文的范围,但我们会验证基于展示位置的定位与“您正在观看的视频?”广告解释之间的对应关系。为此,我们分析了它的:(1)敏感性——当广告商使用基于展示位置的定位时,Google 向用户提供的相应广告解释的程度;以及它的(2)特异性——此广告解释在多大程度上不会出现在未使用基于展示位置的定位的广告上。例如,如果广告解释 EID 1 也出现在使用基于主题的定位的广告上,那么它就不是特定于基于展示位置的定位的。


我们创建了一个仅针对一个特定视频的 Google 广告系列来调查敏感度。然后,我们指示六个浏览器配置文件观看我们定位的视频,收集我们的广告是否显示,并从 Google 收集相应的说明。在我们收集广告的每一个实例中,Google 都提供了“您正在观看的视频”(EID 1)广告说明。我们在三个使用其他展示位置的广告系列中重复了该实验,并且始终获得 EID 1。因此,正如预期的那样,使用基于展示位置的定位的广告会给出 EID 1。


由于广告平台为广告商提供了大量定位参数,因此很难证明其特异性,而且很难证明没有其他定位参数组合会导致 EID 1 解释。困难来自技术和财务问题的结合:在广告预算有限的情况下,很难使用几个浏览器配置文件来捕捉针对对“购物”感兴趣的用户的广告,因为我们的广告被我们的配置文件看到的可能性非常低。


因此,我们测试了四种定位类型(基于主题、基于行为、基于人口统计和基于一般)的特异性,这是所有可能的定位策略的子集,但涵盖了一些最常用的定位技术。为此,我们再次创建了四个使用四种定位类型的广告活动,并尝试收集我们的广告并检查 Google 提供的解释。对于任何广告活动,我们都没有收集“您正在观看的视频”的解释,并且提供的广告解释与表 4 中的分类一致。因此,虽然我们无法证明绝对的特异性,但我们展示了 EID 1 针对这四种定位类别的特异性。


表 4:用户收到广告的原因列表。我们将它们分为八个定位类别:A 基于展示位置的广告;R–重新定位广告;T–基于主题的广告;K–基于关键字;D–基于人口统计;B–基于行为或兴趣;L–基于位置;G–一般定位。分组是基于我们的直觉,而不是基于具有明确证据的广告实验。


我们未能测试的一个问题是,如果广告客户在使用基于展示位置的定位时选择“受众扩展”功能,Google 会提供什么解释。此功能允许 Google 在广告客户最初指定的视频以外的视频上投放广告。如果 Google 为其作为此广告系列的一部分投放的所有广告提供 EID 1 解释,则可能会导致误报,因为 EID 1 解释将出现在 Google 选择的视频上,以及广告客户在其展示位置中指定的视频上。


局限性:由于我们无法完全证明“您正在观看的视频”广告解释的特殊性,我们的结果应该被解读为基于展示位置的定位的上限。


注意:我们在 YouTube 而不是 YouTube Kids 上进行了数据收集。这背后主要的技术原因是 YouTube Kids 不向用户提供“我为什么会看到这个广告?”功能;因此,我们无法推断广告商何时使用了基于展示位置的广告。尽管如此,调查显示,父母使用 YouTube 的人数仍然多于使用 YouTube Kids [45]。因此,调查 YouTube 上的基于展示位置的广告也具有实际意义。


表 5:不同配置文件之间的视频广告重叠。

5.3 广告分析

本节分析了我们在观看 YouTube 上的 620 个视频时使用 6 个个人资料收集的 3,221 个广告。


广告频率。表 3 显示了我们针对不同配置文件收集的视频和浮动广告数量。我们可以看到,没有关联 Google 配置文件的 P1 和 P2 没有收到任何浮动广告,并且视频广告数量最少。对于其他配置文件,我们可以注意到它们收到的广告数量大致相同。不过,广告数量最多的是与具有浏览历史记录的 Google 配置文件关联的浏览器配置文件(P5 和 P6)。


重叠。表 5 报告了六个浏览器配置文件之间的视频广告重叠情况。回想一下,所有六个浏览器配置文件都在相对相同的时间观看相同的视频。为了计算重叠,我们计算了每个配置文件的唯一视频广告集,并计算了不同配置文件之间的交集。我们可以看到 P1 和 P2 之间的重叠为 19%(这两个浏览器配置文件与 Google 配置文件无关)。相比之下,P1 或 P2 与其余配置文件的交集要低得多。与 Google 配置文件关联的四个配置文件(无论是否有浏览历史记录)之间的交集在 15% 到 23% 之间。这表明,与 Google 配置文件不关联的浏览器配置文件收到的广告集与具有关联 Google 配置文件的浏览器配置文件不同。


基于展示位置的广告。本节的核心问题是广告商是否在现实世界中对以儿童为中心的视频采用基于展示位置的定位。表 6 列出了六个浏览器配置文件针对儿童 YTB 儿童列表、儿童种子列表和成人列表中的视频收到的广告对应的广告说明。如果广告说明为“您正在观看的视频” (即 EID 1),我们认为广告是基于展示位置的。如果广告说明为“此帐户或内容已禁用广告个性化。因此,此广告不是根据您的数据个性化的。它的分布取决于其他因素(例如时间或您的地理位置)” (即 EID 27),我们认为广告是非个性化的。如果广告说明是 EID 2 至 26 之一,则为其他。


表格显示,带有基于展示位置的广告说明的广告占 Children YTB Kids List 上收集的广告的 5%;占 Children Seed List 上收集的广告的 14%;占 Adult List 上收集的广告的 23%。因此,我们两个以儿童为中心的列表(Children YTB Kids List 和 Children Seed List)中 7% 的广告都有基于展示位置的广告说明,这表明我们以儿童为中心的列表(Children YTB Kids List 和 Children Seed List)都有基于展示位置的广告说明,这表明现实世界的广告商在以儿童为中心的视频上使用基于展示位置的定位。鉴于广告说明的局限性、我们观看的视频集存在偏见以及我们虚构的浏览器配置文件,这个数字只能被视为这种定位在实践中发生的证据,并不具有代表性。鉴于广告说明的局限性、我们观看的视频集存在偏见以及我们虚构的浏览器配置文件,这个数字只能被视为这种定位在实践中发生的证据,并不具有代表性。


表 6:六个配置文件在不同视频列表中收到的广告的定位类别(来源于广告说明)。


非个性化广告。表 6 显示,儿童 YTB Kids 列表中 76% 的广告、儿童种子列表中 38% 的广告和儿童种子列表中 0% 的广告具有非个性化广告说明。乍一看,这是有道理的,因为 YouTube 可能会对其列入 YouTube Kids 白名单的视频和频道施加比其他儿童视频和成人视频更严格的限制。


然而,引起我们注意的是,虽然 Children YTB Kids List 上的大多数广告都有非个性化广告说明,但也有一些广告有基于展示位置或其他广告说明。因此,我们手动检查了带有非个性化说明的广告的视频与带有其他或基于展示位置说明的广告的视频之间是否存在差异。我们观察到两件事:(1)并非 Children YTB Kids List 中的所有视频都在 YouTube 上重定向到 YouTube Kids(如图 2 所示)。需要澄清的是,虽然 Children YTB Kids List 中的所有视频都可以在 YouTube Kids 上访问,但并非所有视频都在 YouTube 上具有 YouTube Kids 重定向。(2)我们观察到所有带有 YouTube Kids 重定向的视频上的广告都有非个性化广告说明。同时,Children YTB Kids List 中没有 YouTube Kids 重定向的广告都没有非个性化广告说明。这令人惊讶,因为我们在第 4.2 节中的实验表明,我们可以定位出现在 YouTube Kids 上的视频,包括 YouTube Kids 重定向的视频。因此,我们决定测试非个性化广告解释背后的逻辑。


关于非个性化广告解释的正确性。我们假设 Google 为带有 YouTube Kids 重定向的视频提供非个性化广告解释,而不管广告商指定并用于在视频上投放广告的实际定位参数如何。为了测试这一点,我们制作了一个广告系列,并将来自成人列表的 9 个视频、来自儿童种子列表的 5 个不带 YouTube Kids 重定向的视频以及来自儿童 YTB 儿童列表的 15 个带 YouTube Kids 重定向的视频设置为展示位置。Google 提供的统计数据显示,该广告在成人列表上有 466 次展示,在儿童种子列表上有 41 次展示,在儿童 YTB 儿童列表上有 372 次展示。


表 7:YouTube 为我们的广告活动提供的按视频类别划分的广告说明。


在实验期间,我们使用一个单一的配置文件并观看了展示位置中使用的各种视频,以收集我们的广告和 Google 提供的相应广告说明。表 7 展示了我们为广告收集的广告说明。我们可以看到,我们在成人列表视频和儿童种子列表视频上收到的广告说明与我们的广告活动的配置一致(即基于展示位置)。但是,我们在儿童 YTB Kids List 上获得的说明表明此广告不是个性化的。因此,对于相同的广告活动和浏览器配置文件, Google 会根据视频是否有 YouTube Kids 重定向来更改其说明。这种情况具有误导性且令人担忧;不仅可以通过基于展示位置的广告向儿童投放广告,而且许多以儿童为中心的视频上提供的广告说明并未反映出这种定位技术的使用。因此,基于展示位置的定位可能比我们在以儿童为中心的视频上估计的更为频繁,因为 Google 没有提供广告商在我们测试的许多视频上定位广告时使用的精确参数。


最后,P6 的结果也很奇怪,因为它对我们测试的儿童视频中的所有广告都有非个性化的广告解释,而其他配置文件(例如 P3、P4 和 P5)则没有。根据表 5,P6 收到的广告与 P3、P4 或 P5 收到的广告有 15% 到 20% 的重叠。我们检查了常见的广告,发现它们在向 P6 展示时和向其他配置文件展示时有不同的广告解释。我们认为,谷歌检测到与儿童观看视频一致的活动,并更改了 P6 的广告解释政策。我们认为,谷歌目前在儿童视频上提供的广告解释具有误导性,并不像 DSA 第 26 条要求的那样“有意义”。