Більшість людей думають про свій номер соціального страхування тільки тоді, коли про це просить форма або коли на екрані спалахує попередження про крадіжку ідентичності.За цими дев'ятьма цифрами лежить структура, яку уряд колись регулярно опублікував і згодом ускладнив доступ. , намагається відновити цю структуру в одному місці, пропонуючи посилання на шаблони випуску, не пов'язуючи їх з особистою ідентичністю будь-кого. від Андрія Коли урядові дані важко дістатися Передбачення просте: чи був SSN, ймовірно, виданий, коли і де хтось стверджує? до декількох років тому дослідники могли відповісти на це, перевіривши історичні "Таблиці випуску номерів району", які адміністрація соціального страхування виробляла з 1963 по 2011 рік. Сьогодні офіційний архів більше не є публічно доступним онлайн. Перевірка тепер зазвичай вимагає платних послуг SSA або розсіяних неофіційних джерел. Для тих, хто працює з історичними наборами даних, аналізом шахрайства або демографією, ця відсутність створила помітний розрив. Чому один дослідник переробив карту Дослідник з кібербезпеки Дель Андуяр помітив цю прогалину, працюючи над відповідними питаннями в галузі прозорості даних.Замість того, щоб намагатися отримати конфіденційну інформацію або обійти обмеження, він шукав копії оригінальних публічних документів.Протягом місяців він знаходив історичні таблиці з 1936 по 2011 рік у фрагментованих архівах — файлах, які були технічно публічними, але не реалістично відкритими для більшості людей. Результатом стала база даних SSN Area Group, відкрита посилання на шаблони випуску. Вона не включає повні SSN, імена або будь-які особисті ідентифікатори. Натомість, вона відновлює відсутній контекст: які географічні регіони відповідали першим цифрам SSN і в які періоди ці коди були активними. Прозорість, не перетворюючи людей на цілі Публікація будь-якої інформації, пов'язаної з структурами SSN, може викликати занепокоєння, але цей проект зосереджується суворо на моделях, а не на індивідуумах. Він відображає інформацію, яку колись широко поширював уряд, але більше не підтримує в доступному форматі. дані дозволяють дослідникам, журналістам та дослідникам перевірити, чи відповідає префікс числа історичним правилам - не торкаючись приватних записів або отримуючи чутливі подробиці. Ця відмінність відображає ширшу зміну в тому, як люди підходять до ідентифікаційних систем. Прозорість не завжди вимагає впливу. Які доступні шаблони SSN можуть розкрити Дані на рівні шаблону мають кілька практичних застосувань. Дослідники, які порівнюють історичні набори даних, можуть відзначати невідповідності, коли префікси SSN не відповідають заявленому штату або році. Аналітики шахрайства можуть використовувати інформацію як один шар - ніколи не єдиний шар - при виявленні сфабрикованих ідентичностей. Викладачі можуть продемонструвати, як функціонували структури SSN до 2011 року перед введенням рандомізованого нумерування. База даних не є заміною для офіційної перевірки SSA. Замість цього вона служить додатковим пунктом перевірки для розуміння того, як структуровані номери ідентичності і чому з'являються певні аномалії. Етика даних з-за меж установ Проекти, що стосуються ідентифікаційних систем, зазвичай походять від урядових органів або великих установ. зусилля SSN Area Group показують, що незалежні дослідники також можуть сприяти етиці даних, об'єднуючи публічні записи та відкрито документуючи процес. Відновлюючи референдум, який колись мав громадськість, проект підкреслює більш широку точку: можна зробити ідентифікаційні дані, контрольовані урядом, легше зрозуміти, поважаючи при цьому межі конфіденційності. Ця історія була розповсюджена як випуск Sanya Kapoor в рамках HackerNoon's Business Blogging Program. Ця історія була розповсюджена як випуск Sanya Kapoor в рамках HackerNoon's Business Blogging Program.