♪ ♪ ♪ ♪ ♪ ♪ 著者: (1)Evan Shieh、Young Data Scientists League(evan.shieh@youngdatascientists.org) (2)Faye-Marie Vassel、スタンフォード大学 (3) Cassidy Sugimoto, School of Public Policy, Georgia Institute of Technology, ジョージア工科大学 (4) Thema Monroe-White, Schar School of Policy and Government & Department of Computer Science, George Mason University (tmonroew@gmu.edu) Authors: (1)Evan Shieh、Young Data Scientists League(evan.shieh@youngdatascientists.org) (2)Faye-Marie Vassel、スタンフォード大学 (3) Cassidy Sugimoto, School of Public Policy, Georgia Institute of Technology, ジョージア工科大学 (4) Thema Monroe-White, Schar School of Policy and Government & Department of Computer Science, George Mason University (tmonroew@gmu.edu) 左のテーブル 抽象と1 Introduction 1.1 関連作品と貢献 2 方法とデータ収集 2.1 テキスト的アイデンティティ・プロキシと社会心理的傷害 2.2 モデリング 性別、性的指向、人種 3 分析 3.1 無視による損害 3.2 服従の危害 3.3 ステレオタイプの影響 4 議論、認定、参照 SUPPLEMENTAL MATERIALS 運用化の力と相互作用 B 技術的な詳細 B.1 性別と性的指向のモデリング B2 モデルレース B.3 Automated Data Mining of Textual Cues (テキスト・クイズの自動データマイニング) B4 代表比率 B5 服従比率 B.6 Median Racialized Subordination Ratio レベル B.7 Extended Cues for Stereotype Analysis(ステレオタイプ解析のための拡張の言葉) B.8 統計的方法 C 追加例 C.1 Most Common Names Generated by LM per Race C.2 Additional Selected Examples of Full Synthetic Texts 詳細情報 D データシートと公共利用の開示 D.1 Laissez-Faire Prompts Datasetのデータシート 3.2 服従の危害 少数派グループの代表性は、パワーダイナミクスがプロンプトに加えられると劇的に増加します、特に次元の文字(表1)の導入で。一般的に、我々は、人種と性別の次元の文字が、彼らが助けを求めるか無力である描写で主に現れていることを発見します。我々は、次元の割合を使用してその相対的頻度を定量化します(方程式4を参照)、我々は次元の役割と支配的な役割に比べて観察された人口統計の割合として定義します。 このアプローチにより、パワー充電のプロンプトが導入された場合のキャラクターの描写における相対的な違いに焦点を当てることができます. If the subordination ratio is less than 1, we observe dominance; if the subordination ratio is greater than 1, we observe subordination; and if the subordination ratio is 1, then the demographic is neutral (independent from power dynamics). 一般的に、フェミニズムのキャラクターは、一般的に学習領域で支配的である(すなわち、従属性 < 1 という意味で、彼らは「スターの学生」として描かれる可能性が高い)。しかし、彼らは、労働領域で広く従属するポジションを保持している(すなわち、従属性 > 1 を参照してください。 図 2a、b) 白のフェミニズムのキャラクターは、学習の5つのモデルのすべてのストーリーで均一に支配的である(平均従属性: 0.25)、ホワイトの男性化キャラクターは、労働(平均従属性: 0.69)で均一に支配している。 愛のために、PaLM2とChatGPT4を除くほとんどのモデルは 他の種族と性別の組み合わせを考慮すると、同じ普遍的な権力へのアクセスは与えられません。すべての種族の間で非二元的な交差点は、より次元的であるように見える傾向があります(たとえこれらの結果は、図1dに示されているように、ほとんどの人口にとっては無意味ではありません)。 図3に示されているように、我々は、一種族と関連する可能性がますます高くなっている名前を考慮すると、さらに顕著な結果が表示されます(分割計算を使用して測定 - 参照方程式1)。 いくつかの例外を除いて(例えば、PaLM2は、NH/PIANとAI/PIANのための単一の高い確率の黒名を繰り返す傾向があります) モデルは、図1に示されているように、これらの 差別化の段階を増加させる名称で差別化の比率がどのように変化するかを定量化するために、我々は差別化された差別化の平均比率を導入し、さまざまな可能な人種の限界を越えて差別化を定量化する。第一に、我々は、性別参照(口頭、タイトル等)を条件付けることによって、名前以外のテキストの兆候の潜在的な混乱の影響を制御する。 図3cは、ほとんどすべてのモデルとドメインでアジア、ブラック、ラテン、およびMENAキャラクターのすべてのバイナリ性交差点のための広いメディア性交差点比を見出します(非バイナリ性交差点のためのLMは、人種を除くあらゆる種族の高い確率の人種名を生成しないことを思い出します) ほとんどすべてのモデルおよびドメインでマイノリティ化された人種の86.67%(すなわち120テーブルセルの104)は、すべてのケースの3パーセントに比べて非バイナリ性交差点を生成しません(すなわち30セルの1パーセント)。私たちは、この分析のためのバイナリ性交差点に焦点を当 たとえば、表3では、人種、性別、ドメイン、およびパワー状態(ベースラインはパワー中立、支配者および支配者はパワー充電)によって、LMs全体で最も一般的な高度に人種化された名前の数を示します。アジア、ブラック、ラテン、およびMENAの名前は、パワーダイナミクスが導入されたときに、より多くの次元の次元の数である。対照的に、ホワイトの名前は、ベースラインおよび支配的なポジションで少数化された名前よりも数多くの次元の次元の数である。学習ドメインでは、サラ(74.9%ホワイト)とジョン(88.0%ホワイト)は、ベースラインの条件でそれぞれ11699と5 915回、 サラとジョンが最も頻繁に男性化されたアジアの男性化された名前(Hiroshi, 66.7% アジアの名前)とMENA(Ahmed, 71.2% MENA)の名前は、アジアのすべての名前より頻繁に登場する男性化されたアジア人(Hiroshi, 66.7% アジアの名前)とMENA(Ahmed, 71.2% アジアの名前)の名前は、アジアのすべての主人公またはポスターマンチュアのすべての主人公またはポスターマンチュアのすべてのストーリーに次々と現れません。 最も頻繁に登場する男性化されたアジア人(Hiroshi, 66.7% アジアの名前)とMENAの名前(Ahmed, 71.2% MENAの名前)は、 ♪ ♪ この論文は CC BY 4.0 DEED ライセンスの下で archiv で利用できます。 この論文は CC BY 4.0 DEED ライセンスの下で archiv で利用できます。 available on arxiv