paint-brush
Büyük Bilgi İşlem Çağında Gizliliğe Yönelmekile@salkimmich
601 okumalar
601 okumalar

Büyük Bilgi İşlem Çağında Gizliliğe Yönelmek

ile Sal Kimmich9m2024/05/30
Read on Terminal Reader

Çok uzun; Okumak

Kişisel olarak tanımlanabilir bilgileri içeren veriler, en yüksek güvenlik standardını gerektirir. Büyük bilgi işlem, tamamen "anonimleştirilmiş" veri kümelerinin kombinasyonlarından yeniden tanımlamanın bireyleri tanımlamak için kullanılabilmesini sağladığından, gizliliğin anlamı sonsuza kadar değişti. Çevrimiçi gizliliği koruyacaksak zihniyetimizi değiştirmemiz gerekiyor.
featured image - Büyük Bilgi İşlem Çağında Gizliliğe Yönelmek
Sal Kimmich HackerNoon profile picture
0-item

Bak, bunu anlıyorum uyumluluk güvenlik DEĞİLDİR .

Ancak gizlilik, güvenlikle gerçekten benzersiz bir şekilde etkileşime girer: kişisel olarak tanımlanabilir bilgileri içeren veriler, en yüksek güvenlik standardını gerektirir. Büyük bilgi işlem, tamamen "anonimleştirilmiş" veri kümelerinin kombinasyonlarından yeniden tanımlamanın bireyleri kolayca tanımlamak için kullanılabileceği anlamına geldiğinden, gizliliğin anlamı sonsuza kadar değişti.

Çevrimiçi gizliliği koruyacaksak zihniyetimizi değiştirmemiz gerekiyor.

Hesaplama, özellikle büyük hesaplama - kişisel olarak tanımlanabilir kalıplarda yoğunlaşmak için seyrek bilgi vektörleri kullanarak yüksek boyutlu verilerdeki kalıpların kilidini açar. Kaç kişinin veya benzer özelliklere sahip grubun niceliksel olarak ölçülebilmesi Unicity tarafından niceliksel olarak ölçülür.


Birlik, İngilizce dilinde sıklıkla somutlaşmış nezaket ve açıklık olarak kullanılır.


Matematikte teklik , matematiksel bir nesnenin benzersizliğini belirtmek olarak tanımlanır; bu genellikle belirli özellikleri karşılayan tek bir nesnenin olduğu veya belirli bir sınıftaki tüm nesnelerin eşdeğer olduğu anlamına gelir .


Kriptografide Teklik Mesafesi bugünün odak noktası değil, ancak fikri açıklamaya yardımcı olabilir: Saldırganın şifreleme algoritmasını bildiğini ve erişime sahip olduğunu varsayarak, şifreleme anahtarının benzersiz bir şekilde kurtarılabilmesi için bize ne kadar şifreli metnin gerekli olduğunu söyler. hem şifreli metin hem de düz metinle ilgili bazı istatistikler. Temel olarak, kazmaya başlamadan önce iğneyi bulmak için samanlığın ne kadar büyük olması gerektiğini hesaplamanıza olanak tanır.


Büyük veri kümelerindeki tekliği ölçme fikri, ilk olarak insanların %90'ından fazlasının Netflix Ödülü veri kümesinde benzersiz bir şekilde yeniden tanımlanabildiğini ortaya koyan bir çalışmayla meşhur oldu: "hakkında çok az şey bilen bir düşmanın, bireysel bir abone, bu abonenin veri setindeki kaydını kolaylıkla tanımlayabilir. İnternet Film Veritabanını arka plan bilgisi kaynağı olarak kullanarak, bilinen kullanıcıların Netflix kayıtlarını başarılı bir şekilde belirledik, görünürdeki siyasi tercihlerini ve diğer potansiyel olarak hassas bilgileri ortaya çıkardık."

Büyük Seyrek Veri Kümelerinin Güçlü Anonimleştirilmesi


2021 yılında tekrar şunu hatırladım: “ Ülke ölçeğindeki konum veri kümelerinde bile yeniden kimlik belirleme riski yüksek kalıyor .” Bu benim kendi kurumum olan Ulusal Sağlık Enstitüleri'nden geldi.


Bilinçli farkındalık olmadan beyin ağlarını değiştirip değiştiremeyeceğimizi görmek için insan beyni üzerinde sinyal işleme çalışmaları yapıyordum. Spoiler: Tamamen yapabilirsiniz . Bu veriler oldukça hassas, yüksek düzeyde tanımlanabilir bireysel veriler gibi görünebilir; ancak bundan çok daha tehlikeli veri kümeleri vardır. Bilinen Neflix kullanımınız gibi.


ABD Hükümeti tarafından finanse edilen tıbbi araştırmalar, mahremiyetin makul ölçüde korunabildiği durumlarda bu veri setlerinin kamuya açık olmasını gerektirir; ancak yalnızca veri seti içindeki bir bireyin değil, aynı zamanda veri seti içindeki bir kişinin yeniden tanımlanması riskini de hesapladığınızda yakındaki coğrafi konumda kolayca bulunabilenler.


Özetin tamamını okumakta fayda var:

“Anonim veriler kişisel veri olarak kabul edilmese de son araştırmalar bireylerin sıklıkla nasıl yeniden tanımlanabileceğini gösterdi. Bilim adamları, önceki bulguların yalnızca küçük ölçekli veri kümeleri için geçerli olduğunu ve büyük ölçekli veri kümelerinde mahremiyetin korunduğunu savundu. 3 aylık konum verilerini kullanarak , (1) yeniden tanımlama riskinin veri kümesi boyutuyla yavaş yavaş azaldığını gösteriyoruz, (2) bu azalmayı popülasyon çapındaki üç marjinal dağılımı dikkate alan basit bir modelle tahmin ediyoruz ve (3) kanıtlıyoruz bu birlik dışbükeydir ve doğrusal bir alt sınır elde eder. Tahminlerimiz, dört noktalı yardımcı bilgi kullanılarak 60 milyon kişilik bir veri kümesinde insanların %93'ünün benzersiz şekilde tanımlanacağını ve %22'lik bir alt sınırla tanımlanacağını gösteriyor. Beş puan mevcut olduğunda bu alt sınır %87'ye çıkmaktadır. Birlikte ele alındığında sonuçlarımız, bireylerin mahremiyetinin ülke ölçeğindeki konum veri kümelerinde bile korunma ihtimalinin çok düşük olduğunu gösteriyor."


Bu, bilgisayar korsanlarının genellikle sağlık, finans ve devlet kayıtlarında elde ettiği altındır. Dört altın yardımcı veri noktasına ihtiyaçları var ve bireyi bulabilirler.


Samanlıkta iğne bulmak değil bu.

Bir iğne yığınının içinde belirli bir iğneyi bulmaktır.

Tek ihtiyacım olan o iğneyle ilgili üç aylık konum verisi ve bingo , anladım.


Veri kümelerindeki teklik çoğu kuruluş için büyük bir kör noktadır.


Bu büyük bir uyumluluk sorunu olmalı, ancak burada da bir kör nokta var.


Gözlemlemeyi öğrenene kadar bu büyük bir güvenlik riskidir.


Az önce IAPP AI Yönetişim Eğitimini aldım. Bu, Yapay Zeka'ya yönelik gizlilik kaygılarıyla ilgili küresel düzenlemeleri anlamak için Nisan 2024'te uygulamaya konan yeni standarttır. Teknik bir geçmişim var, bu eğitimi tüm avukatların, düzenleyicilerin ve uyum görevlilerinin zihinlerine girmek için kullanmak istedim. sıklıkla etkileşimde bulunduğum. Mevcut düzenleme ortamını özetleme biçiminden son derece memnunum ve sertifikasyonun konuyla ilgili eğitiminizin her yıl güncellenmesini gerektirmesi hoşuma gidiyor: bu düzenleyici ortamda işler hızlı ilerliyor.

Bir an için Yapay Zeka Yönetişim Profesyonellerinin anlamasını istediğim şeye odaklanmak istiyorum.

Keşke yüksek teklik riski taşıyan bir veri kümeniz varsa, Gizlilik Arttırıcı Teknolojilerdeki dikkate almanız gereken teknik gelişmeleri ele almış olsaydık. Keşke küçük veya büyük veri setlerinde teklik riskini azaltmak için bilinen herhangi bir niceliksel ölçümü kapsamış olsaydık. Keşke birlik konusunu ele alsaydık, nokta.


Keşke Gizliliği İyileştiren Teknolojilerin (PET'ler) kullanımının ne kadar benzersiz olduğunu anlatmış olsaydık: Linux Çekirdeğinin ilkellerine kadar, bu teknoloji özel olarak gizliliğin korunması göz önünde bulundurularak tasarlanmıştır. PET'ler, yüksek riskli veri kümeleri için hem uyumluluk hem de güvenlik risklerini aynı anda azaltabilir.


Güvenlik riskleri genellikle tehdit modelleme biçiminde gözden geçirilir. Bu, üç faktörün çarpımının spekülatif hesaplamasıdır: Tehdidin türü (iç aktör, tedarik zinciri zayıflığı), etkinin büyüklüğü (paydaşlara, son kullanıcılara, iş itibarına) ve olasılık.

RİSK = TEHDİT x ETKİ x OLASILIK.

Olasılığa odaklanalım: Bunu bilinen/algılanan varlık değeri olarak hesaplama eğilimindeyim ve hatta algoritmalar gibi fikri mülkiyet üzerine önerilen bir fiyat etiketi koyma eğilimindeyim. Bu önemli. Algoritmik IP'nizi ürününüz gibi değerlendirmelisiniz, çünkü özellikle yapay zekada kesinlikle sizin ürününüzdür.


Bu aynı zamanda dikkatinizi tehdit modelinize net bir şekilde odaklar. İşletmeniz özellikle üretken algoritmalar etrafında fikri mülkiyet oluşturuyorsa geleneksel güvenlik yöntemleri işe yaramayacaktır.


Nedenini açıklayayım:


Artık verileri şifreleme konusunda gerçekten iyiyiz.

Ne yazık ki şifrelenmiş verileri hesaplamak kelimenin tam anlamıyla imkansızdır.


İşletmeniz bilişime dayanıyorsa (ve buraya kadar okuduysanız muhtemelen öyledir), o zaman yüzey alanınıza yönelik gizlilik amaçlı güvenlik tehditleri hakkında karar vermekten siz sorumlusunuz. Gizlilik, uyumluluğun aslında güvenlikle tamamen uyumlu olabildiği teknolojinin bir parçasıdır.


Sinir bozucu şifrelenmiş verilere dönecek olursak: Şifrelenmiş olmasının birkaç iyi nedeni var. PET Gizli Bilgi İşlem için en sevdiğim gerçek kullanım durumu, küresel insan kaçakçılığına karşı mücadeledir.


Dünyada her zaman küresel çapta yaygın olan bu sorunun kurbanlarının hakları ve özgürlükleri için mücadele eden iyi insanlar olmuştur. Geleneksel olarak, OSINT teknikleri, genellikle fotoğrafik veya videografik bilgiler içeren veritabanlarının konumlarını belirlemek için kullanılırdı; yasal olarak bu kanıtları saklamanıza ve saklamanıza izin VERİLMEZ, çünkü amaç bu kayıtlara yönelik herhangi bir yeteneği sınırlamaktır. yeni bir dağıtım vektörüne sahip olmak.


Bu durum bir sorun yarattı, çünkü yırtıcılar bilgiyi çevrimiçi ortamda kolayca taşıyabiliyor, mimarilerini gerektiği gibi merkezileştirip dağıtabiliyorlardı. Sorunla mücadele edenler aynı esnekliğe sahip değildi.


Makul düzenleme, talihsiz ikincil etkiler.


Şimdi, Gizli Bilgi İşlem bize Adalet Umudu Özel Veri Değişimi'nde adil bir mücadele veriyor: bu son derece yüksek riskli kayıtların, hesaplamayı donanım tabanlı, onaylanmış bir ortamda gerçekleştirerek kullanımdaki verileri koruyan bir Güvenilir Yürütme Ortamında nasıl merkezileştirileceğinin bir gösterimi. Güvenilir Yürütme Ortamı: Bu verilerin insan gözüyle değil, yalnızca algoritmalar tarafından gözlemleneceği yer.


Ve daha iyi oluyor. Şifreleme konusunda çok iyi olduğumuz için bu artık büyük, birleşik bir veri ekosisteminin parçası haline gelebilir. Dünyanın dört bir yanındaki kuruluşlar, kayıtlarını bir araya getirebiliyor ve yalnızca bireyler hakkında değil, konumlar ve potansiyel hareket kalıpları hakkında potansiyel olarak bireysel olarak tanımlanabilir bilgiler elde etmek için yalnızca dört altın yardımcı önlemin büyüsünü kullanabiliyor. Gizliliğin izole bir yürütme ortamı tarafından korunduğu adil bir mücadele: bu görüntüleri bir daha yalnızca algoritmik gözler görebilecek.

Birlik büyük bir kötülük değildir.

Unicity bir araç, gerçekten iyi bir araç. Unicity, kör noktanızı bir hesaplamayla değiştirir. Kendi kuruluşunuzun Yapay Zeka Uygunluk Değerlendirmesine yönelik ilk girişimlerine bir göz atın: risk yönetimi, veri yönetişimi ve siber güvenlik uygulamaları. Mevcut düzenlemenin ötesinde sisteminizin son kullanıcılar için oluşturabileceği toplam riski düşünün ve veri yoğun bir dünya için tehdit modellemeye başlayın. Bunu doğru anlayalım.


Yapay zeka düzenlemelerindeki her çerçeveyi kapsayan günler geçirdiğimiz günlerde çok şey öğrendim. AIGP eğitiminde sağlanan Düzenleme Çerçevesine dayanarak, orta ve büyük ölçekli herhangi bir kuruluşta bunun nasıl ele alınacağına ilişkin mevcut tavsiyem aşağıdadır.

Yapay Zeka Yönetişimi için Mevcut Çerçevelere Öncelik Verme

Zenginleştirilmiş Yapay Zeka Yönetişim Çerçevesi

Kapsamlı Risk Yönetimi (NIST AI RMF)

  1. Yapılandırılmış Risk Yönetimi Süreci:
    • Riskleri Belirleyin : Yapay zeka ile ilgili potansiyel riskleri belirlemek için kapsamlı risk değerlendirmeleri yapın.
    • Risklerin Değerlendirilmesi : Belirlenen risklerin ciddiyetini ve olasılığını değerlendirin.
    • Riskleri Yönetin : Belirlenen riskleri azaltmak için stratejiler uygulayın.
    • İzleme ve Güncelleme : Yapay zeka sistemlerini yeni riskler açısından sürekli izleyin ve risk yönetimi stratejilerini buna göre güncelleyin.

Etik Yapay Zeka Geliştirme (OECD Yapay Zeka İlkeleri)

  1. Etik Hususlar :
    • İnsan Odaklı Tasarım : Yapay zeka sistemlerinin insan girdisine öncelik vermesini ve insan ihtiyaçlarını ve deneyimlerini karşılamasını sağlayın.
    • Şeffaflık ve Açıklanabilirlik : Yapay zeka sistemlerinin nasıl karar verdiğine ilişkin açık ve anlaşılır bilgiler sağlayın.
    • Hesap Verebilirlik : Yapay zeka sistemlerinin eylemleri ve sonuçları için net bir hesap verebilirlik oluşturun.

Mevzuata Uygunluk (GDPR, AB Yapay Zeka Yasası)

  1. Veri Koruma ve Gizlilik :
    • GDPR Uyumluluğu : Veri minimizasyonu ve anonimleştirme de dahil olmak üzere kişisel verileri korumaya yönelik önlemler uygulayın.
    • AB Yapay Zeka Yasası : Yapay zeka sistemlerini riske göre sınıflandırın ve yüksek riskli yapay zeka sistemlerine yönelik özel gereksinimlere uygunluğu sağlayın.
    • Veri Etki Değerlendirmeleri : Gizlilik risklerini değerlendirmek için Veri Koruma Etki Değerlendirmeleri (DPIA'lar) ve yapay zeka uygunluk değerlendirmeleri gerçekleştirin.

Teknik Hususlar

  1. Gizliliği Artıran Teknolojiler (PET'ler) :
    • Diferansiyel Gizlilik : Grup kalıplarını analiz ederken veri gizliliğini sağlamak için diferansiyel gizlilik uygulayın.
    • Birleşik Öğrenme : Bireysel veri noktalarını paylaşmadan yapay zeka modellerini merkezi olmayan veriler üzerinde eğitmek için birleşik öğrenmeyi kullanın.
    • Homomorfik Şifreleme : Şifrelenmiş veriler üzerinde hesaplamalar gerçekleştirmek için homomorfik şifrelemeyi kullanın.
  2. Birlik ve Yeniden Tanımlama Riskleri :
    • Tekliği Ölçün : Gizliliği sağlamak için veri kümelerinde yeniden tanımlama riskini niceliksel olarak ölçün.
    • Tekliği İzleyin ve Azaltın : Veri kümelerinin tekliğini sürekli izleyin ve azaltmak için stratejiler uygulayın.

Uygulamanız Üzerindeki Zaman İçinde Etkiyi Ölçmeye çalışın

  1. Merkezi Yönetişim Organı Oluşturun: GDPR, AB Yapay Zeka Yasası, NIST Yapay Zeka RMF ve OECD Yapay Zeka İlkelerine uyumu sağlayan, yapay zeka yönetiminden sorumlu özel bir ekip oluşturun.
  2. Entegre Politika ve Prosedürler Geliştirin: Veri koruma, risk yönetimi, şeffaflık ve hesap verebilirliğe odaklanarak dört düzenleyici çerçevenin tümünün ilkelerini entegre eden politikalar oluşturun.
  3. Uyumluluk için Teknolojiden Yararlanın: Uyumluluk ve risk yönetimi çabalarını desteklemek için gizliliği artıran teknolojiler (PET'ler) ve yapay zeka izleme araçları gibi gelişmiş teknolojileri kullanın.
  4. Yönetişim çerçevesinin yeni gelişmelerle gelişmesini sağlayarak yapay zeka yönetişimindeki düzenleyici değişiklikler ve gelişmeler hakkında güncel kalın. Düzenleyici ufuk çizgisini koruyun, ancak Hala fırsatınız varken bu sorunu farklı düşünmeye başlayın. Sorumlu hesaplamayı gerçekten yapabileceğimiz tüm yolları düşünün.


Eğer bireyleri tanımlamak istiyorsak o yüzey alanlarını güvenli hale getirelim.


Bireyleri tanımlamak istemiyorsak, sisteminizin çıktılarında devam eden yeniden tanımlama riskini izlemek için bir yol uygulayın.



Herkese açık ve ihlal edilen veri kümelerinde daha düşük düzeyde birlik hepimiz için harika olurdu. Bu, ekibinizin, mahremiyet amaçlı bir saldırgan tarafından yakınsak veri kullanımı riskinin niceliksel ölçümüyle yapabileceği bir veri hijyeni uygulamasıdır. Kişisel verilerin yeniden kimlik tespitinden korunması konusunda çıtayı kesinlikle yükseltebiliriz ve yükseltmeliyiz. Bunu ancak kendi verilerimizle ölçersek yapmaya başlayabiliriz. Gizliliği artıran teknolojiler ve bilgi işlemdeki değişen düzenleme eğilimleri konusunda ciddiyseniz, bana bununla ilgili ilginç bir soru gönderin . Sistemleriniz eğitim sırasında zorunlu olarak yüksek riskli verilerle ilgileniyorsa şunu da umursayabilirsiniz: Yapay zekada öğrenmeyi unutma veya Yüksek Etki Yüksek Lisans Diplomalarına Yönelik Güvenlik Tehditleri .