Ang karamihan ng mga tao ay nag-iisip tungkol sa kanilang Social Security number lamang kapag ang isang form ay nag-iisip para sa kanya o kapag isang identity-theft warning flashes sa buong screen. Sa ilalim ng mga nine digits ay isang strukturong na ang pamahalaan ay nag-publish na isang beses rutina at pagkatapos ay gumawa ng mga problema sa pag-access. Ang trabaho ay nagpapakita ng isang interesado na tanong: maaari ba ang transparency sa paligid ng mga data ng identity na kontrolado ng pamahalaan nang walang kompromiso sa privacy? sa pamamagitan ng Andujar Kapag ang mga data ng pamahalaan ay malaki upang makakuha ng Ang premise ay simpleng: ang isang SSN ay malaki na inilathala kapag at kung saan ang isang tao ay nag-aalok? Sa loob ng ilang taon na ang nakalipas, ang mga mananaliksik ay maaaring tumugon na sa pamamagitan ng checking historical "Area Number Issuance Tables," na ang Social Security Administration ay inilathala mula 1963 hanggang 2011. Ang mga tables na nakikipag-ugnayan ang unang halimbawa ng isang SSN sa estado at halimbawa taon ng inilathala. Ngayon, ang opisyal na archive ay hindi pa rin magagamit sa publiko online. Verification ngayon ay karaniwang nangangailangan ng pagbayad SSA serbisyo o dispersed unofficial na mga pulutong. Para sa lahat ng nagtatrabaho sa historical datasets, fraud analysis, o demographics, na hindi na lumikha ng isang malinaw na gap. Bakit ang isang mananaliksik rebuilt ang mapa Ang cybersecurity researcher Del Andujar nakikita ang gap na ito habang nagtatrabaho sa mga relasyon na mga isyu sa transparency ng data. Sa halip ng pagkuha ng sensitibo na impormasyon o pag-aalis ng mga limitasyon, siya ay naghahanap para sa mga kopya ng mga orihinal na mga publikong dokumento. Sa loob ng ilang buwan, nagtatrabaho siya ang mga historikal na tables mula sa 1936 hanggang 2011 sa mga fragmented archives - mga file na technically public pero hindi realistically makita para sa karamihan ng mga tao. Ang resulta ay naging ang database ng SSN Area Group, isang open reference ng mga pattern ng emission. Ito ay hindi naglalaman ng buong SSNs, mga pangalan, o anumang mga personal na identifier. Sa halip, ito ay i-restore ang nangangailangan ng konteksto: kung ano ang mga geographical na mga rehiyon ay sumusunod sa unang digita ng isang SSN at kung ano ang mga panahon na ang mga code na ito ay aktibo. Transparency nang hindi gumagawa ng mga tao sa mga target Ang pag-publish ng anumang bagay na may kaugnayan sa mga estruktura ng SSN ay maaaring lumikha ng mga pangangailangan, ngunit ang proyekto na ito ay nakikipag-ugnayan sa mga pattern, hindi ng mga indibidwal. Ito ay nagpapakita ng impormasyon na ang pamahalaan ay nag-distribusyon nang malaki ngunit hindi na magtatrabaho sa isang malakas na format. Ang data ay nagbibigay-daan para sa mga mananaliksik, mga journalist, at mga investigator upang i-verify kung ang prefix ng isang numero ay matatagpuan sa mga kasaysayan - nang walang pag-atake sa mga private record o makakuha ng mga sensitibo na detalye. Ang pagkilala na ito ay nagpapakita ng isang mas mababang pagbabago sa kung paano ang mga tao ay nakikipag-ugnayan sa mga sistema ng identity. Transparency ay hindi kailanman nangangailangan ng pag-exposure. Ano ang Accessible SSN Patterns ay maaaring ilagay Pattern-level data ay may ilang mga practical mga paggamit. Ang mga mananaliksik na naghahambing ng mga historical datasets ay maaaring magkakaroon ng mga inconsistencies kung saan ang mga prefix ng SSN ay hindi matatagpuan sa claimed estado o taon. Ang mga analysts ng mga fraud ay maaaring gamitin ang impormasyon bilang isang layer - hindi lamang ang isang layer - kapag nagtatagumpay ang mga fake identities. Ang mga educator ay maaaring ipakita kung paano nagtatrabaho ang pre-2011 SSN structures bago ang pagsusuri ng randomized numbering. Ang database ay hindi isang substitute para sa opisyal na SSA verification. Sa halip, ito ay gumagana bilang isang karagdagang checkpoint para sa pagkuha ng malaman kung paano ang mga numero ng identity ay naka-structure at bakit ang anumang mga anomaliya ay nagpapakita. Data Ethics mula sa mga institusyon Ang mga proyekto na nagtatrabaho sa mga sistema ng identity ay karaniwang nagsisimula mula sa mga gobyerno o malaking institusyon. Ang pag-aaral ng SSN Area Group ay nagpapakita na ang mga independiyenteng mga mananaliksik ay maaaring magbigay ng kontribusyon sa data ethics sa pamamagitan ng pagkuha ng mga publikong mga dokumento at pagdokumento ng proseso sa openly. Sa pamamagitan ng pag-rebuilding ng isang reference na ang publiko ay nagkaroon ng isang oras, ang proyekto ay nag-aalok ng isang mas malalaking punto: ito ay posible na gawin ang mga data ng identity na nakontrol ng pamahalaan ay mas madaling maunawaan habang nagtatagumpay sa limitasyon ng privacy. Para sa lahat ng interesado sa mekanika ng mga sistema ng identity, ang balanse ay isang mahahalagang bahagi ng pag-uusap. Ang story na ito ay inilathala bilang isang release ng Sanya Kapoor sa ilalim ng HackerNoon's Business Blogging Program. Ang story na ito ay inilathala bilang isang release ng Sanya Kapoor sa ilalim ng HackerNoon's Business Blogging Program.