ほとんどの人が自分の社会保障番号について考えるのは、フォームがそれを要求する時、またはアイデンティティ盗難警告が画面に映る時だけです。その9桁の背後には、政府が一度公開し、その後アクセスが難しくなった構造があります。 この研究は、誰かの個人的なアイデンティティとつながることなく、発行パターンの参照を提供し、その構造を一箇所に再構築しようとしています。 アンドリュー 政府のデータがアクセスしにくいとき 数年前までは、研究者は、社会保障局が1963年から2011年にかけて作成した歴史的「地域番号発行表」をチェックすることで、SSNの最初の数字を州および発行年と結びつけることができた。 今日では、公式アーカイブはもはやオンラインで一般に公開されていません。検証には、通常、有料のSSAサービスまたは分散された非公式の情報源が必要です。 なぜある研究者が地図を再構築したのか サイバーセキュリティの研究者であるDel Andujar氏は、データの透明性に関連する問題に取り組む際、このギャップに気付きました。機密情報を取得したり、制限を回避しようとした代わりに、彼はオリジナルの公的文書のコピーを検索しました。 結果として、SSN Area Groupデータベースは、発行パターンのオープンな参照となりました. 完全なSSN、名前、または個人識別子は含まれていません. 代わりに、それが欠けている文脈を復元します: SSNの最初の数字に合致した地理領域と、これらのコードがアクティブだった期間。 人々をターゲットに変えることなく透明性 SSNの構造に関連する何かを公開することは懸念を引き起こす可能性がありますが、このプロジェクトは、個人ではなくパターンに厳密に焦点を当てています。政府がかつて広く配布したが、もはやアクセス可能な形式で維持していない情報を反映しています。 この区別は、人々がアイデンティティシステムにどのように接近するかというより広範な変化を反映しています. Transparency does not always require exposure. Sometimes it simply means restoring documentation that institutions allowed to fade out of reach. 透明性は常に曝露を必要としません。 アクセス可能なSSNパターンが明らかにできること パターンレベルのデータにはいくつかの実用的な用途があります。 歴史的データセットを比較する研究者は、SSNプレフィックスが主張された州または年と一致しない不一致を示すことができます。 詐欺アナリストは、偽造されたアイデンティティを発見するときに、情報を一つの層として使用することができます - 決して唯一の層ではありません。 教育者は、ランダム番号化の導入前に2011年以前のSSN構造がどのように機能していたかを示すことができます。 データベースは、公式のSSA検証の代わりではありません。代わりに、アイデンティティ番号がどのように構成され、特定の異常がなぜ現れるのかを理解するための追加のチェックポイントとして機能します。 外部機関からのデータ倫理 アイデンティティシステムを扱うプロジェクトは、通常、政府機関や大規模な機関から生まれる。SSNエリアグループの取り組みは、独立した研究者が公開レコードをまとめ、プロセスを公開的にドキュメントすることによって、データ倫理にも貢献できることを示しています。 かつて市民が持っていた参照点を再構築することにより、このプロジェクトはより広い点を強調する:政府が管理するアイデンティティデータを、プライバシーの限界を尊重しながら理解しやすくすることが可能である。 このストーリーは、HackerNoonのBusiness Blogging Programの下でSanya Kapoorによってリリースされたものです。 このストーリーは、HackerNoonのBusiness Blogging Programの下でSanya Kapoorによってリリースされたものです。