著者:
(1)ティニナーヌ・メディクーン、グルノーブル・アルプ大学、CNRS、グルノーブルINP、LIGフランス;
(2)オアナ・ゴガ、LIX、CNRS、Inria、エコール・ポリテクニーク、パリ工科大学フランス
(3)ジュリエット・セネシャル、リール大学、CRDP、DReDIS-IRJSフランス。
このセクションでは、実際の広告主が配置ベースのターゲティングを利用して子供に商品を宣伝しているかどうかを調査するための測定方法を提案します。
私たちの方法は、ユーザーが YouTube 動画を視聴しているときに表示される広告に関する情報を取得できるブラウザ拡張機能に基づいています。大まかに言うと、測定方法は 6 つのブラウザ プロファイルに子供向けの動画を視聴するように指示し、表示される広告を収集するというものです。
広告キャプチャ ツール。広告がユーザーに表示されるたびに、DOM が更新され、視聴中の動画の HTML コードに新しい要素が追加されます。そのため、広告をキャプチャするために、ブラウザ拡張機能は DOM の変更を監視するだけです。拡張機能は Chrome で動作し、動画広告 (視聴中の動画の最初、途中、または最後に表示される動画広告) とフロート カード広告 (動画の視聴中にナビゲーション バーの上に表示される画像、GIF、またはテキストを含む広告) の両方をキャプチャできます。ブラウザ拡張機能が広告を検出すると、次の情報 (主にテキスト) が収集されます。
• 広告データ:広告主の名前、広告主の YouTube チャンネル、広告主のリンク、フロート広告の場合は画像または GIF、動画広告の場合は広告の URL。
• 動画視聴データ: 視聴された動画 (広告が表示される動画) のタイトル、URL、説明、視聴回数、動画の公開日、対応するチャンネル、チャンネルのフォロワー数を収集します。
• YouTube Kids リダイレクト: YouTube がユーザーを YouTube Kids にリダイレクトすることを提案した場合に収集します (これは、動画が YouTube Kids にあることを意味します。付録の図 2 を参照)。
• 広告の説明:ブラウザ拡張機能は、「なぜこの広告が表示されるのですか?」機能に表示されるデータを収集します。この機能は、広告動画の左下にあるボタン ○i をクリックするとアクセスできます。モーダルが開き、広告が表示された理由がユーザーに説明されます。ボタンのクリックをシミュレートすることでこの情報を収集し、クリック後に送信されたリクエストへの応答を回復します。モーダルを閉じるには、モーダルのウィンドウ外で別のクリックをシミュレートします。
動画を視聴しているユーザーのプロフィール/ID に関する情報は収集されません (各ユーザーは、ブラウザ拡張機能によって生成された一意の識別子に関連付けられます)。このデータは、安全な HTTPS 接続を介してラボ サーバーに送信され、保存されます。ストレージ サーバーはファイアウォールによって保護されています。
ペルソナ。YouTube で動画を視聴しているときに表示される広告は、ブラウザ プロファイル(ブラウザに存在する、以前にアクセスしたサイトを追跡する Cookie によって決定されます)と、ユーザーがログインしている場合はユーザーの Google プロファイルによって異なります。そのため、より広い視野を持ち、ブラウザ プロファイルが結果にどのような影響を与えるかを説明するために、異なるパラメータを持つ 6 つの閲覧プロファイルを作成しました(表 2 を参照)。
私たちは、(1) Google プロフィールが関連付けられておらず、閲覧履歴のないブラウザ プロファイルを 2 つ作成しました。(2) 性別指定がなく、閲覧履歴もない空の Google プロフィールに関連付けられたプロファイルを 2 つ(Google アカウントを作成するには生年月日を指定する必要があるため、プロファイルには年齢のみが設定されています)。(3) Google アカウントと閲覧履歴に関連付けられたプロファイルを 2 つ。アカウントの 1 つは性別が女性に設定され、もう 1 つは男性に設定されています。女性プロファイルでは、衣服、猫の餌、フォルクスワーゲン車、フランスの動物愛護に関連する 4 つのサイトを訪問しました。男性プロファイルでは、整形手術に関連する 1 つのサイトを訪問しました。P3~P6 については、Google 広告設定ページをチェックして、さまざまなプロファイルに対して Google が推測した興味 / 関心を調査しました [34]。P3 と P4 には、予想どおり、興味 / 関心がありません。P5 プロファイルには、ファッションとトレンド、ペット、自動車と乗り物への興味があり、P6 にはボディケアとフィットネスへの興味がありました。
Google では、子供 (18 歳未満) が Google プロフィールを作成することを許可していません。プロフィールの選択は、子供が YouTube で動画を視聴する方法について Google が提示している可能性に基づいています。(1) 子供は、どのプロフィールにも関連付けられていないシークレット ブラウザを使用できます。(2) 子供は、誤った年齢でアカウントを作成できます。(3) 子供は、サイトやアプリケーションで既にこのアカウントを使用している可能性があり、閲覧履歴がすでに存在している親のアカウントを使用できます。
計測。2022年4月28日から2022年5月5日までYouTubeでデータ収集を実施しました。2台の異なるコンピューター上の6つのプロファイルから同時にデータを収集しました。6つのSeleniumセッションを作成して、6つのペルソナを同時に起動します。ペルソナは、3つのリスト(子供YTBキッズリスト、子供シードリスト、大人リスト)の各チャンネルで最新の10本の動画を閲覧します。各動画は最初から最後まで視聴されました。拡張機能のおかげで、配信された各広告は収集され、サーバー上に保存されます。停止点は、YouTubeチャンネルリスト全体の最後(620本の動画)です。表3は、各リストと各プロファイルで収集した動画とフロートカード広告の数を示しています。6つのプロファイル全体で、3,221の広告を収集しました。
実験の難しさに関する注記:データ収集には時間がかかります。(1) 広告は動画の途中でランダムに表示される可能性があり、動画中に表示される広告の数は決まっていないため、すべての広告をキャッチするには動画を最後まで視聴する必要があります。動画の長さは 2 分未満から 1 時間以上までさまざまです。(2)「この広告が表示される理由」の情報を回復するためにシミュレートされたダブルクリックにより、閉じないモーダルがトリガーされることがあり、動画の進行が中断されるため、モーダルを閉じて動画を再開するために人間の介入が必要になります。これにより、実験の規模が制限されます。ただし、この論文は広告主が子供をターゲットにするために配置ベースの広告を使用するかどうかに焦点を当てており、子供向けの動画に表示される広告の代表的な特徴を提供することには焦点を当てていないため、6 つのブラウザー プロファイルを使用した計測で十分であると考えています。
動画に広告が表示される理由は、広告主が設定したターゲティング パラメータと、広告を配信するプラットフォームのアルゴリズムによって異なります。この論文では、配置ベースの広告に焦点を当てています。したがって、動画に表示される一連の広告を前提として、動画をターゲットにした広告 (配置ベース) と他の理由で表示された広告 (関心ベース、リターゲティングなど) を区別することが課題となります。
私たちの最初のアイデアは、複数のブラウザ プロファイルを使用して同じビデオを同時に視聴し、すべてのプロファイルに表示される広告のみをプレースメント ベースの広告と見なすことでした。6 つのプロファイルで収集した 668 個の固有の広告のうち、6 つのプロファイルすべてで受信された広告は 2 つだけでした。参考までに、39 個の広告は 4 つ以上のプロファイルで受信され、128 個の広告は 2 つ以上のプロファイルで受信されました。ただし、この方法では残念ながら、偽陽性 (広告主が非常に大規模なキャンペーンを開始し、競合他社よりも高い入札を行っているため、広告がすべてのプロファイルに表示される) と偽陰性 (広告はプレースメント ベースである可能性がありますが、予算の制約と競争のため、すべてのビデオに表示されない) の両方が発生します。したがって、この方法では信頼できるグラウンド トゥルースを提供できません。
幸いなことに、Google は「この広告が表示される理由」機能で、特定の広告を受け取った理由をユーザーに説明しています (セクション 2 を参照)。そこで、これらの説明が、プレースメントベースの広告とそれ以外の広告を区別するのに十分な精度であるかどうかを調査することにしました。Chrome 拡張機能は、収集したすべての広告の「この広告が表示される理由」ボタンで情報を収集できました。表 4 は、Google が提供するさまざまな説明を示しています。調査はフランス語で行われたため、表の理由はフランス語から翻訳されており、英語では構文が若干異なる可能性があることに注意してください。これらの理由は、8 つの広範なターゲティング カテゴリに分類されています。P – プレースメント ベースの広告、R – リターゲティング広告、T – テーマ ベースの広告、K – キーワード ベース、I – アイデンティティ ベース、B – 行動または興味 / 関心ベース、L – 場所ベース、および G – 一般的なターゲティング。さまざまな広告の説明は、Googleが提供するさまざまなターゲティングタイプをカバーしており、「あなたが見ていたウェブサイトのトピック」や「Googleによるあなたの住宅居住状況の推定」など、提供される説明は非常に正確です。私たちにとってさらに興味深いのは、EID 1の説明「あなたが見ている動画」がプレースメントベースの広告に対応しているように見えることです。もう1つの興味深い説明は、EID 27の「このアカウントまたはコンテンツでは広告のパーソナライズが無効になっています。したがって、この広告はあなたのデータに基づいてパーソナライズされていません。」で、広告がパーソナライズされていないことが明確に述べられています。Googleは子供向けの動画にはパーソナライズされた広告を配信しないと主張しているため、これは興味深いことです[63, 64]。
検証。これまでの研究では、Facebook の広告説明は不完全で誤解を招くものであることが示されている [4]。YouTube の広告説明を完全に監査することはこの論文の範囲外ですが、私たちは、プレースメント ベース ターゲティングと「今見ている動画は?」という広告説明との対応関係を検証します。そのために、(1)感度- 広告主がプレースメント ベース ターゲティングを使用する場合、これが Google がユーザーに提供する対応する広告説明となる程度。(2)特異度- この広告説明が、プレースメント ベース ターゲティングを使用しない広告には表示されない程度。たとえば、広告説明 EID 1 がテーマ ベース ターゲティングを使用する広告にも表示される場合、それはプレースメント ベース ターゲティングに固有のものではありません。
感度を調査するため、特定の 1 つの動画のみをターゲットにした Google 広告キャンペーンを作成しました。次に、6 つのブラウザ プロファイルに、ターゲットにした動画を視聴し、広告が表示されたかどうかを収集し、Google から対応する説明を収集するように指示しました。広告を収集したすべてのインスタンスで、Google は「視聴中の動画」(EID 1) の広告説明を提供しました。他の配置を使用した 3 つの広告キャンペーンでこの実験を繰り返しましたが、常に EID 1 が得られました。したがって、予想どおり、配置ベースのターゲティングを使用する広告には EID 1 が付与されます。
広告プラットフォームは広告主に多数のターゲティング パラメータを提供するため、特異性を証明するのはより困難であり、他のターゲティング パラメータの組み合わせでは EID 1 の説明にならないことを証明するのは困難です。この難しさは、技術的な問題と財務的な問題の組み合わせから生じます。たとえば、広告予算が限られている場合、少数のブラウザ プロファイルを使用して「ショッピング」に関心のあるユーザーをターゲットにした広告をキャッチするのは困難です。プロファイルで広告が表示される可能性が非常に低いためです。
そこで、私たちは 4 種類のターゲティング (テーマベース、行動ベース、人口統計ベース、一般ベース) に関して特異性をテストしました。これは、考えられるすべてのターゲティング戦略のサブセットですが、最もよく使用されるターゲティング手法の一部をカバーしています。このために、私たちは再び 4 種類のターゲティングを使用する 4 つの広告キャンペーンを作成し、広告を収集して Google が提供する説明を確認しようとしました。どの広告キャンペーンでも、「視聴中の動画」の説明は収集しておらず、提供された広告の説明は表 4 の分類と一致していました。したがって、絶対的な特異性を証明することはできませんが、これらの 4 つのターゲティング カテゴリに関して EID 1 の特異性を示しています。
私たちがテストできなかった懸念事項の 1 つは、広告主がプレースメント ベースのターゲティングを使用する際に「オーディエンス拡張」機能を選択した場合に Google がどのような説明を提供するかということです。この機能により、Google は広告主が最初に指定した動画以外の動画に広告を配信できます。Google がこのキャンペーンの一環として配信するすべての広告に EID 1 の説明を提供すると、誤検知が発生する可能性があります。これは、EID 1 の説明が、広告主がプレースメントで指定した動画に加えて、Google が選択した動画にも表示されるためです。
制限事項: 「視聴中の動画」広告の説明の特異性を完全に証明することはできないため、結果は配置ベースのターゲティングの上限として解釈する必要があります。
注:私たちはYouTube KidsではなくYouTubeでデータ収集を行いました。その主な技術的な理由は、YouTube Kidsではユーザーに「なぜこの広告が表示されるのですか?」という機能が提供されていないため、広告主がプレースメントベースの広告を使用しているかどうかを推測できないためです。しかし、調査によると、親はYouTube KidsよりもYouTubeをまだ多く使用しています[45]。したがって、YouTubeでのプレースメントベースの広告を調査することも現実的に意味があります。
このセクションでは、YouTube で 620 本の動画を視聴したときに 6 つのプロファイルで収集した 3,221 件の広告を分析します。
広告の頻度。表 3 は、さまざまなプロファイルで収集した動画広告とフロート広告の数を示しています。Google プロファイルに関連付けられていない P1 と P2 はフロート広告を受信しておらず、動画広告の数が最も少ないことがわかります。他のプロファイルについては、ほぼ同じ数の広告を受信していることがわかります。それでも、最も多くの広告が表示されるのは、閲覧履歴のある Google プロファイルに関連付けられたブラウザ プロファイル (P5 と P6) です。
重複。表 5 は、6 つのブラウザ プロファイル間での動画広告の重複を示しています。6 つのブラウザ プロファイルはすべて、ほぼ同じ時間に同じ動画を視聴していることを思い出してください。重複を計算するために、各プロファイルの動画広告の一意のセットを計算し、異なるプロファイル間の共通部分を計算しました。P1 と P2 の重複は 19% であることがわかります (2 つのブラウザ プロファイルは Google プロファイルに関連付けられていません)。対照的に、P1 または P2 とその他のプロファイルとの共通部分ははるかに低くなっています。閲覧履歴の有無にかかわらず、Google プロファイルに関連付けられた 4 つのプロファイル間の共通部分は 15% から 23% です。これは、Google プロファイルに関連付けられていないブラウザ プロファイルが受け取る広告のセットは、Google プロファイルが関連付けられているブラウザ プロファイルとは異なることを示しています。
配置ベースの広告。このセクションの中心的な問題は、広告主が現実世界の子供向け動画で配置ベースのターゲティングを採用しているかどうかです。表 6 は、子供向け YTB キッズ リスト、子供向けシード リスト、および大人向けリストの動画について、6 つのブラウザー プロファイルが受信した広告に対応する広告の説明を示しています。広告の説明が「視聴中の動画」 (つまり EID 1) である場合、広告は配置ベースであるとみなします。広告の説明が「このアカウントまたはコンテンツでは広告のパーソナライズが無効になっています。したがって、この広告はデータに基づいてパーソナライズされていません。配信は他の要因 (時間や地理的位置など) によって異なります」(つまり EID 27) である場合、広告は非パーソナライズであるとみなします。広告の説明が EID 2 から 26 のいずれかである場合は、その他です。
表は、配置ベースの広告説明のある広告が、子供 YTB キッズ リストで収集された広告の 5%、子供シード リストで収集された広告の 14%、大人リストで収集された広告の 23% を占めていることを示しています。したがって、両方の子供向けリスト (子供 YTB キッズ リストと子供シード リスト) 全体の広告の 7% に配置ベースの広告説明があり、子供向けリスト (子供 YTB キッズ リストと子供シード リスト) に配置ベースの広告説明があることを示唆しており、現実世界の広告主が子供向けの動画で配置ベースのターゲティングを使用していることを示しています。広告説明の制限、私たちが視聴する動画の偏り、私たちが作り上げたブラウザー プロファイルを考えると、この数字は、そのようなターゲティングが実際には行われているものの、代表的ではないという証拠としてのみ見なされるべきです。広告説明の制限、私たちが視聴する動画の偏り、私たちが作り上げたブラウザー プロファイルを考えると、この数字は、そのようなターゲティングが実際には行われているものの、代表的ではないという証拠としてのみ見なされるべきです。
パーソナライズされていない広告。表 6 は、子供向け YTB キッズ リストの広告の 76%、子供向けシード リストの広告の 38%、子供向けシード リストの広告の 0% にパーソナライズされていない広告の説明があることを示しています。一見すると、これは理にかなっています。YouTube は、YouTube Kids の一部としてホワイトリストに登録した動画やチャンネルに、他の子供向け動画や大人向け動画よりも厳しい制限を課している可能性があるからです。
しかし、私たちの注意を引いたのは、子供向けYTBキッズリストの広告の大半にはパーソナライズされていない広告の説明がある一方で、配置ベースまたはその他の広告の説明がある広告もいくつかあるということでした。そこで、パーソナライズされていない説明のある広告のある動画と、その他の説明や配置ベースの説明のある広告のある動画との間に違いがあるかどうかを手動で確認しました。次の2つの点に気づきました。(1)図2に示すように、子供向けYTBキッズリストのすべての動画にYouTubeからYouTube Kidsへのリダイレクトがあるわけではありません。明確に言えば、子供向けYTBキッズリストのすべての動画はYouTube Kidsでアクセスできますが、YouTubeにYouTube Kidsリダイレクトがあるわけではありません。(2)YouTube Kidsリダイレクトのある動画のすべての広告にパーソナライズされていない広告の説明があることがわかりました。同時に、子供向けYTBキッズリストでYouTube Kidsリダイレクトのない広告には、パーソナライズされていない広告の説明はありません。セクション4.2の実験では、YouTube Kidsリダイレクトの動画を含め、YouTube Kidsに表示される動画をターゲットにできることが示されていたため、これは意外でした。そこで、私たちはパーソナライズされていない広告の説明の背後にあるロジックをテストすることにしました。
パーソナライズされていない広告の説明の正確性について。Googleは、広告主が指定し、動画に広告を配信するために使用された実際のターゲティング パラメータに関係なく、YouTube Kids リダイレクトのある動画に対してパーソナライズされていない広告の説明を提供していると仮定しました。これをテストするために、広告キャンペーンを作成し、YouTube Kids リダイレクトのない Adult List の動画 9 本、Children Seed List の動画 5 本、YouTube Kids リダイレクトのある Children YTB Kids List の動画 15 本を配置として設定しました。Google が提供した統計によると、広告は Adult List で 466 回、Children Seed List で 41 回、Children YTB Kids List で 372 回表示されました。
実験中、私たちは 1 つのプロファイルを使用して、配置に使用されたさまざまな動画を視聴し、広告と Google によって提供された対応する広告説明を収集しました。表 7 は、広告について収集した広告説明を示しています。アダルト リストの動画と子供向けシード リストの動画の両方で受け取った広告説明は、広告キャンペーンの構成 (つまり、配置ベース) と一致していることがわかります。ただし、子供向け YTB キッズ リストで受け取った説明は、この広告がパーソナライズされていないことを示しています。したがって、同じ広告キャンペーンとブラウザ プロファイルに対して、 Google は動画に YouTube Kids リダイレクトがあるかどうかに応じて説明を変更しました。この状況は誤解を招きやすく、警戒すべきものです。配置ベースの広告を通じて子供を広告のターゲットにできるだけでなく、多くの子供向け動画で提供される広告説明は、このターゲティング手法の使用を反映していません。したがって、 Google は、テストした多くの動画で広告主が広告をターゲットにするために使用する正確なパラメーターを提供していないため、子供向け動画では配置ベースのターゲティングが私たちの推定よりも頻繁に行われる可能性があります。
最後に、P6 の結果も奇妙です。なぜなら、テストした子供向け動画のすべての広告にパーソナライズされていない広告説明があるのに対し、P3、P4、P5 などの他のプロファイルにはそれがないからです。表 5 によると、P6 が受信した広告と P3、P4、P5 が受信した広告には 15% ~ 20% の重複があります。共通広告を確認したところ、P6 に表示されたときと他のプロファイルに表示されたときは広告説明が異なることがわかりました。Google は、子供が動画を視聴していることに一致するアクティビティを検出し、P6 の広告説明ポリシーを変更したと考えられます。子供向け動画で Google が現在提供している広告説明は誤解を招くものであり、DSA の第 26 条で要求されている「意味のある」ものではないと考えられます。
この論文はCC 4.0ライセンスの下でarxivで公開されています。