paint-brush
সর্বজনীনভাবে উপলব্ধ নন-পিআই-এর উপর ভিত্তি করে লিঙ্কডইনে ন্যানোটার্গেটিং বিশ্লেষণ এবং বাস্তবায়নদ্বারা@netizenship
161 পড়া

সর্বজনীনভাবে উপলব্ধ নন-পিআই-এর উপর ভিত্তি করে লিঙ্কডইনে ন্যানোটার্গেটিং বিশ্লেষণ এবং বাস্তবায়ন

দ্বারা Netizenship Meaning in Online Communities7m2024/05/30
Read on Terminal Reader

অতিদীর্ঘ; পড়তে

এই কাগজটি LinkedIn-এ ন্যানোটার্গেটিং-এর গোপনীয়তা ঝুঁকিগুলিকে অন্বেষণ করে, প্রদর্শন করে যে সর্বজনীনভাবে উপলব্ধ ডেটা থেকে অবস্থান এবং পেশাদার দক্ষতার সমন্বয় ব্যবহারকারীদেরকে অনন্যভাবে সনাক্ত করতে পারে এবং তাদের হাইপার-পার্সোনালাইজড বিজ্ঞাপনে উন্মুক্ত করতে পারে, সামাজিক মিডিয়া প্ল্যাটফর্মগুলিতে ডেটা গোপনীয়তা এবং নিরাপত্তা সম্পর্কে উদ্বেগ তুলে ধরে।
featured image - সর্বজনীনভাবে উপলব্ধ নন-পিআই-এর উপর ভিত্তি করে লিঙ্কডইনে ন্যানোটার্গেটিং বিশ্লেষণ এবং বাস্তবায়ন
Netizenship Meaning in Online Communities HackerNoon profile picture
0-item

লেখক:

(1) অ্যাঞ্জেল মেরিনো, টেলিমেটিক ইঞ্জিনিয়ারিং বিভাগ ইউনিভার্সিড কার্লোস III ডি মাদ্রিদ {[email protected]};

(2) জোসে গনজালেজ-কবানাস, UC3M-স্যান্টান্ডার বিগ ডেটা ইনস্টিটিউট {[email protected]}

(3) অ্যাঞ্জেল কুয়েভাস, টেলিম্যাটিক ইঞ্জিনিয়ারিং বিভাগ ইউনিভার্সিড কার্লোস III ডি মাদ্রিদ এবং UC3M-স্যান্টান্ডার বিগ ডেটা ইনস্টিটিউট {[email protected]};

(4) Rubén Cuevas, Telematic Engineering Universidad Carlos III de Madrid এবং UC3M-Santander Big Data Institute {[email protected]} বিভাগ।

লিঙ্কের টেবিল

বিমূর্ত এবং ভূমিকা

লিঙ্কডইন বিজ্ঞাপন প্ল্যাটফর্ম পটভূমি

ডেটাসেট

পদ্ধতি

লিঙ্কডইনে ব্যবহারকারীর স্বতন্ত্রতা

ধারণার ন্যানোটার্গেটিং প্রমাণ

আলোচনা

সম্পর্কিত কাজ

নৈতিকতা এবং আইনি বিবেচনা

উপসংহার, স্বীকৃতি, এবং রেফারেন্স

পরিশিষ্ট

বিমূর্ত

সাহিত্যের একটি অংশ একাধিকবার দেখিয়েছে যে কয়েকটি নন-পার্সোনাল আইডেন্টিফায়েবল ইনফরমেশন (নন-পিআইআই) আইটেমগুলিকে একত্রিত করাই একটি ডেটাসেটে লক্ষ লক্ষ বা এমনকি কয়েক মিলিয়ন ব্যবহারকারী সহ ব্যবহারকারীকে অনন্য করে তুলতে যথেষ্ট। এই কাজটি গবেষণার এই ক্ষেত্রটিকে প্রসারিত করে, এটি প্রদর্শন করে যে কয়েকটি অ-পিআইআই সর্বজনীনভাবে উপলব্ধ বৈশিষ্ট্যগুলির সংমিশ্রণ একটি তৃতীয় পক্ষ দ্বারা সক্রিয় করা যেতে পারে যাতে হাইপার-পার্সোনালাইজড বার্তা সহ ব্যবহারকারীকে স্বতন্ত্রভাবে লক্ষ্য করা যায়। এই কাগজটি প্রথমে একটি পদ্ধতি প্রয়োগ করে যে প্রদর্শন করে যে অবস্থানের সংমিশ্রণ এবং 6টি বিরল (বা 14টি র্যান্ডম) পেশাদার দক্ষতা একটি ব্যবহারকারীর দ্বারা তাদের LinkedIn প্রোফাইলে রিপোর্ট করা ∼800M ব্যবহারকারীদের দ্বারা গঠিত একটি ব্যবহারকারী বেসে অনন্য হওয়ার জন্য যথেষ্ট যার সম্ভাবনা 75। % সাহিত্যের পূর্ববর্তী কাজের তুলনায় এই ক্ষেত্রে একটি অভিনব বৈশিষ্ট্য হল যে লিঙ্কডইন প্রোফাইলে রিপোর্ট করা অবস্থান এবং দক্ষতা প্ল্যাটফর্মে নিবন্ধিত অন্য কোনও ব্যবহারকারী বা সংস্থার কাছে সর্বজনীনভাবে অ্যাক্সেসযোগ্য এবং উপরন্তু, বিজ্ঞাপন প্রচারের মাধ্যমে সক্রিয় করা যেতে পারে। . আমরা কাগজের তিনজন লেখককে লক্ষ্য করে ধারণা পরীক্ষার একটি প্রমাণ চালিয়েছি। আমরা দেখিয়েছি যে অবস্থানের সাথে কনফিগার করা সমস্ত বিজ্ঞাপন প্রচারাভিযান এবং লেখকের লিঙ্কডইন প্রোফাইল থেকে পুনরুদ্ধার করা ≥13 এলোমেলো পেশাদার দক্ষতা সফলভাবে লক্ষ্যযুক্ত ব্যবহারকারীর কাছে একচেটিয়াভাবে বিজ্ঞাপন সরবরাহ করেছে। এই অনুশীলনটিকে ন্যানোটার্গেটিং হিসাবে উল্লেখ করা হয় এবং এটি লিঙ্কডইন ব্যবহারকারীদের সম্ভাব্য গোপনীয়তা এবং নিরাপত্তা ঝুঁকি যেমন ম্যালভার্টাইজিং বা ম্যানিপুলেশনের কাছে প্রকাশ করতে পারে।


কীওয়ার্ড লিঙ্কডইন · অনলাইন বিজ্ঞাপন · ব্যবহারকারীর গোপনীয়তা · ন্যানো টার্গেটিং

1। পরিচিতি

তৃতীয় পক্ষের ব্যবহারকারীদের তাদের সম্মতি ছাড়াই স্বতন্ত্রভাবে সনাক্ত করার ক্ষমতা নাগরিকদের গোপনীয়তা কতটা ভঙ্গুর তা বোঝার একটি ভাল থার্মোমিটার। ব্যবহারকারীকে শনাক্ত করার একটি সুস্পষ্ট উপায় হল ব্যক্তিগত শনাক্তকরণযোগ্য তথ্য (PII) যেমন ইমেল, ফোন নম্বর, ডাক ঠিকানা ইত্যাদি। PII-এর বড় বেআইনি ডেটাবেস তৈরি করা ব্যবহারকারীদের জন্য গোপনীয়তার ঝুঁকি উপস্থাপন করতে পারে। সেই কারণেই ঘন ঘন সচেতনতামূলক প্রচারাভিযান ব্যবহারকারীদের ইমেল, এসএমএস, হোয়াটসঅ্যাপ মেসেজ ইত্যাদি থেকে সতর্ক থাকার নির্দেশ দেয়, যা অজানা উত্স থেকে আসে৷ প্রকৃতপক্ষে, বর্তমান ডেটা সুরক্ষা প্রবিধান যেমন GDPR [1] স্পষ্টভাবে বলে যে PII হল ব্যক্তিগত ডেটা এবং এর জন্য (বেশিরভাগ ক্ষেত্রে) ব্যবহারকারীর সম্মতি প্রয়োজন। একজন ব্যবহারকারীকে স্বতন্ত্রভাবে সনাক্ত করতে এবং সম্ভাব্যভাবে লক্ষ্য করার একটি আরও সূক্ষ্ম পদ্ধতি হল একাধিক নন-পিআইআই আইটেমগুলিকে একত্রিত করা যা বিচ্ছিন্নভাবে ব্যক্তিগত ডেটা হিসাবে বিবেচিত হয় না। নন-পিআইআই-এর উপর ভিত্তি করে এই শনাক্তকরণ সনাক্ত করা কঠিন কিন্তু একটি উল্লেখযোগ্য ঝুঁকি তৈরি করে। এই কারণেই সাম্প্রতিক বছরগুলিতে সাহিত্যে অ-পিআইআই ডেটার উপর ভিত্তি করে ব্যবহারকারীর স্বতন্ত্রতাকে সম্বোধন করা হয়েছে।


গবেষণা সাহিত্য বারংবার প্রমাণ করেছে যে কয়েকটি নন-পিআইআই আইটেমগুলি একটি ব্যবহারকারীকে বড় ডেটাসেটে অনন্যভাবে সনাক্ত করার জন্য যথেষ্ট। উদাহরণস্বরূপ, মাত্র 4টি মোবাইল ফোন কল রেকর্ড 1.5 মিলিয়ন ব্যবহারকারীর ডেটাসেটে একজন ব্যবহারকারীকে সনাক্ত করতে পারে [2]। একইভাবে, 1.1 মিলিয়ন ব্যবহারকারীর একটি ব্যবহারকারী বেসে, একজন ব্যক্তিকে আলাদা করার জন্য শুধুমাত্র 4টি ক্রেডিট কার্ড ক্রয় রেকর্ডের প্রয়োজন হয় [3]।


একইভাবে, 8টি সিনেমার রেটিং এবং আনুমানিক পর্যালোচনার তারিখ 480k Netflix ব্যবহারকারীদের মধ্যে একজন ব্যবহারকারীকে আলাদা করতে পারে [4]। লিঙ্গ, পিন কোড এবং জন্মতারিখ একত্রিত করলে 1990 এবং 2000 মার্কিন আদমশুমারিতে যথাক্রমে 87% এবং 63% নাগরিকের পরিচয় প্রকাশ করতে পারে [5][6]। এছাড়াও, 15টি জনসংখ্যাগত বৈশিষ্ট্য যেকোনো ডেটাসেটে 99.98% আমেরিকানদের পুনরায় সনাক্ত করতে পারে [7]।


এই গবেষণাগুলি মানুষের গোপনীয়তার ভঙ্গুরতা মূল্যায়ন করার জন্য একটি অমূল্য অবদানের প্রতিনিধিত্ব করে। যাইহোক, এই সমস্ত কাজ তাত্ত্বিক রয়ে গেছে এবং ব্যবহারকারীদের নিরাপত্তা এবং/অথবা গোপনীয়তার সাথে আপস করে নির্দিষ্ট আক্রমণে নন-পিআইআই ডেটা আইটেমগুলি কীভাবে সক্রিয় করা যেতে পারে তা নিয়ে আলোচনা করে না। আমরা বিশ্বাস করি যে গবেষণার এই ক্ষেত্রটি সম্পূর্ণ করার জন্য প্রাকৃতিক পদক্ষেপটি পদ্ধতি এবং পরীক্ষা-নিরীক্ষার বিকাশ ঘটানো হচ্ছে তা দেখানোর জন্য যে নন-পিআইআই আইটেমগুলির সংমিশ্রণ অনুশীলনে সক্রিয় করা যেতে পারে ব্যবহারকারীদের পৃথকভাবে লক্ষ্য করার জন্য এবং (সম্ভাব্যভাবে) তাদের নিরাপত্তা এবং/অথবা আপস করতে। গোপনীয়তা


লেখকের সর্বোত্তম জ্ঞানের জন্য, ক্ষেত্রের একমাত্র পূর্ববর্তী অধ্যয়ন যা কার্যত দেখায় যে একটি বিজ্ঞাপনের মাধ্যমে একক ব্যবহারকারীর কাছে পৌঁছানোর জন্য নন-PII আইটেমগুলির সংমিশ্রণ সক্রিয় করা যেতে পারে [8]। এই কাজটি ধারণা পরীক্ষার একটি প্রমাণ সঞ্চালন করে, এটি দেখায় যে একজন আক্রমণকারী একজন ব্যবহারকারীর কাছ থেকে ∼20 এলোমেলো বিজ্ঞাপনের পছন্দগুলি উন্মোচন করতে সক্ষম হচ্ছে একটি ন্যানোটার্গেটিং বিজ্ঞাপন প্রচারের মাধ্যমে তাদের লক্ষ্য করতে পারে, অর্থাৎ, বিজ্ঞাপনটি একচেটিয়াভাবে লক্ষ্যযুক্ত ব্যবহারকারীর কাছে পৌঁছায়। এটিই প্রথম বাস্তব প্রমাণ যে অ-পিআইআই তথ্য পৃথক ব্যবহারকারীদের লক্ষ্য করার জন্য সুস্পষ্ট সম্মতি ছাড়াই ব্যবহার করা যেতে পারে যাতে সেই উপায়ে অনন্যভাবে পৌঁছানো যায়। যাইহোক, স্কেলে রিপোর্ট করা কৌশলটির ব্যবহারিক ব্যবহারের একটি উল্লেখযোগ্য সীমাবদ্ধতা রয়েছে। এটির জন্য আক্রমণকারীকে ব্যবহারকারীদের বিজ্ঞাপন পছন্দগুলি অ্যাক্সেস করতে হবে, যা একটি জটিল কাজ কারণ সেগুলি সর্বজনীনভাবে উপলব্ধ নয়৷ এই সীমাবদ্ধতা সম্ভাব্য আক্রমণকারীদেরকে কমিয়ে দেয় যারা শক্তিশালী প্রযুক্তিগত জ্ঞানের সাথে ব্যবহারকারীর বিজ্ঞাপনের পছন্দ অনুমান করতে সক্ষম। যদিও উল্লেখ করা কাজটি একটি অত্যন্ত গুরুত্বপূর্ণ গবেষণা অবদান, আমরা বিশ্বাস করি যে এটি গুরুত্বপূর্ণ যে গবেষণা সম্প্রদায় আরও গবেষণায় অবদান রাখে যা দেখায় যে এটি ব্যবহারকারীদের দ্বারা সক্রিয়ভাবে প্রকাশ করা সর্বজনীনভাবে উপলব্ধ নন-পিআইআই আইটেমগুলির সাপেক্ষে হাইপার-ব্যক্তিগত আক্রমণগুলি বাস্তবায়ন করা সম্ভব। এই ধরনের অধ্যয়ন প্রমাণ করবে যে নন-পিআইআই আইটেম, প্রায়ই ব্যক্তিগত ডেটা হিসাবে বিবেচিত হয় না, ব্যবহারকারীদের জন্য গুরুতর গোপনীয়তা এবং/অথবা নিরাপত্তা ঝুঁকি জড়িত হতে পারে।


আমাদের কাজ দেখায় যে কয়েক মিলিয়ন ব্যবহারকারীকে স্বতন্ত্রভাবে হাইপার-পার্সোনালাইজড মেসেজ দিয়ে টার্গেট করা হতে পারে যা কিছু অ-পিআইআই সর্বজনীনভাবে উপলব্ধ ডেটা আইটেমগুলিকে একত্রিত করে। এই লক্ষ্যে, এই গবেষণায়, আমরা নিজেদেরকে তিনটি প্রয়োজনীয়তা আরোপ করেছি: (i) ব্যবহারকারীর ভিত্তির মধ্যে সারা বিশ্বে বিতরণ করা দশ বা কয়েক মিলিয়ন ব্যবহারকারী অন্তর্ভুক্ত করা উচিত; (ii) একটি স্বতন্ত্র ব্যবহারকারীকে লক্ষ্য করার জন্য প্রয়োজনীয় নন-PII ডেটা আইটেমগুলি অবশ্যই সর্বজনীনভাবে উপলব্ধ হতে হবে এবং (iii) অ-পিআইআই আইটেমগুলিকে বহিরাগত তৃতীয় পক্ষের দ্বারা সক্রিয় করা যেতে পারে যাতে স্বতন্ত্রভাবে হাইপার-পার্সোনালাইজড বার্তাগুলির সাথে ব্যবহারকারীদের কাছে পৌঁছানো যায়৷ আমাদের সর্বোত্তম জ্ঞান অনুসারে, সাহিত্যের পূর্ববর্তী কোন কাজই একই সাথে এই তিনটি প্রয়োজনীয়তা পূরণ করে না।


আমাদের কাগজ প্রমাণ করে যে একজন স্বতন্ত্র ব্যবহারকারী লিঙ্কডইন-এ অবস্থান (দেশ, অঞ্চল বা শহর) এবং তাদের প্রোফাইলে উপলব্ধ পেশাদার দক্ষতার সমন্বয় ব্যবহার করে বিজ্ঞাপনের মাধ্যমে ন্যানোটার্গেট করা যেতে পারে। এটি নিম্নলিখিত তিনটি পূর্ববর্তী প্রয়োজনীয়তা পূরণ করে: (i) LinkedIn-এর 800 মিলিয়ন ব্যবহারকারী রয়েছে, অর্থাৎ, বিশ্বব্যাপী জনসংখ্যার প্রায় 10% উপলব্ধ, (ii) এর ব্যবহারকারীদের অবস্থান এবং পেশাগত দক্ষতা সর্বজনীনভাবে উপলব্ধ নন-PII আইটেম যে কেউ লিঙ্কডইনে লগ ইন করেছেন। তাই, যে কেউ সহজেই প্রয়োজনীয় তথ্য পেতে পারে যা লিঙ্কডইন-এ একজন ব্যবহারকারীকে অনন্যভাবে সনাক্ত করে এবং (iii) ব্যবহারকারীদের কাছে হাইপার-পার্সোনালাইজড বিজ্ঞাপনগুলি সরবরাহ করার জন্য লিঙ্কডইন বিজ্ঞাপন ম্যানেজারের মাধ্যমে পেশাদার দক্ষতা এবং অবস্থানের সমন্বয় সক্রিয় করা যেতে পারে। বাস্তবে, এর মানে হল যে একজন ব্যবহারকারীকে ন্যানোটার্গেট করার জন্য শুধুমাত্র একটি লিঙ্কডইন অ্যাকাউন্ট থাকা, লক্ষ্যযুক্ত ব্যবহারকারীর প্রোফাইল থেকে অবস্থান এবং পেশাদার দক্ষতা পুনরুদ্ধার করা এবং সেই তথ্য ব্যবহার করে একটি বিজ্ঞাপন প্রচারাভিযান কনফিগার করা প্রয়োজন। এটি একটি খুব সাধারণ অপারেশন যা PII নয় এমন আইটেমগুলিকে ব্যবহার করে LinkedIn-এ ন্যানোটার্গেটিং প্রচারাভিযান/আক্রমণ চালাতে ইচ্ছুক অনেক তৃতীয় পক্ষকে সক্ষম করতে পারে।


আমরা আমাদের কাজকে দুই ভাগে ভাগ করেছি। কাগজের প্রথম অংশে, আমরা 1699 জন ব্যবহারকারীর কাছ থেকে সংগৃহীত 39k দক্ষতার তথ্য সহ একটি ডেটাসেট ব্যবহার করি এবং আমরা একটি ডেটা-চালিত মডেল তৈরি করি যা লিঙ্কডইনে ব্যবহারকারীর স্বতন্ত্রতার সম্ভাব্যতা নির্ধারণ করে এবং সর্বজনীনভাবে উপলব্ধ N পেশাদার দক্ষতাগুলিকে একত্রিত করে তাদের প্রোফাইল। কাগজের দ্বিতীয় অংশে, আমরা মডেলের ফলাফল ব্যবহার করি ধারণা পরীক্ষা-নিরীক্ষার প্রমাণ বাস্তবায়নের জন্য, এই কাগজের তিনজন লেখককে লক্ষ্য করে, প্রমাণ করে যে লিঙ্কডইন-এ ন্যানোটার্গেটিং প্রচারণা চালানো সম্ভব।


LinkedIn তার বিজ্ঞাপন নির্দেশিকাতে দাবি করে যে একটি প্রচারাভিযান শুরু করার লক্ষ্যে সদস্যদের ন্যূনতম সংখ্যা 300, কিন্তু এই সীমাটি সহজেই বাইপাস করা যেতে পারে যা আমরা বিশ্বাস করি এটি একটি বাস্তবায়ন বাগ। আমরা তাদের প্রস্তাবিত প্রক্রিয়া অনুসরণ করে LinkedIn-এ আমাদের গবেষণার দ্বারা উন্মোচিত গোপনীয়তার দুর্বলতার কথা জানিয়েছি। দুর্ভাগ্যবশত, প্ল্যাটফর্ম ম্যানেজাররা যারা আমাদের রিপোর্ট পেয়েছেন তারা আমাদের গবেষণার ফলাফলগুলিকে একটি দুর্বলতার প্রতিনিধিত্ব করে বলে মনে করেননি।


এই কাজটি বেশ কয়েকটি মূল ফলাফল দিয়েছে:


• তাদের রিপোর্ট করা দক্ষতা সেট থেকে 14 (23) এলোমেলোভাবে নির্বাচিত দক্ষতার সাথে ব্যবহারকারীদের অবস্থান একত্রিত করা তাদের 75% (90%) সম্ভাবনা সহ LinkedIn-এ অনন্য করে তোলে। আমরা যদি এর পরিবর্তে সর্বনিম্ন জনপ্রিয় দক্ষতা ব্যবহার করি, তবে একই স্তরের অনন্যতা অর্জনের জন্য আমাদের শুধুমাত্র 6 (8) দক্ষতার প্রয়োজন।


• আমাদের ধারণা পরীক্ষার প্রমাণ দেখায় যে অবস্থান এবং ≥13 র্যান্ডম দক্ষতা ব্যবহার করে সমস্ত প্রচারাভিযান সফলভাবে তিনটি লক্ষ্যযুক্ত লেখককে ন্যানোটার্গেট করেছে৷


• আমাদের সর্বোত্তম জ্ঞান অনুসারে, এটিই প্রথম গবেষণা যা প্রমাণ করে যে সর্বজনীনভাবে উপলব্ধ নন-পিআইআই ডেটা কার্যকরভাবে অনন্য নাগরিকদের লক্ষ্যবস্তুতে ব্যবহার করা যেতে পারে।


চিত্র 1: আমাদের ডেটা নমুনায় ব্যবহারকারীর প্রোফাইল প্রতি দক্ষতার সংখ্যার CDF।


চিত্র 2: আমাদের ডেটাসেটে 4941 অনন্য পেশাদার দক্ষতার সাথে যুক্ত বিশ্বব্যাপী দর্শকের আকারের CDF।


চিত্র 3: N=1 থেকে N=50 দক্ষতার মধ্যে বিবেচনা করা পেশাদার দক্ষতার সংখ্যা অনুসারে আমাদের পদ্ধতিতে ব্যবহৃত ভেক্টরগুলির দৈর্ঘ্য।


এই কাগজটি CC BY-NC-ND 4.0 DEED লাইসেন্সের অধীনে arxiv-এ উপলব্ধ