এই রিয়েল-টাইম, ম্যাকওএসের জন্য ডিভাইসে অ্যান্টিফিশিং সমাধান রেফারেন্স-ভিত্তিক সনাক্তকরণকে একটি নতুন স্তরে নিয়ে যায়, ম্যাক ব্যবহারকারীদের অবিলম্বে সতর্ক করে যে তারা একটি ফিশিং ওয়েবসাইটে রয়েছে। প্রথম, পটভূমি 2023 সালে কতগুলি অনন্য ফিশিং ওয়েবসাইট প্রকাশিত হয়েছিল? অ্যান্টিফিশিং ওয়ার্কিং গ্রুপ প্রায় 5 মিলিয়ন। 2024 এর শুরুতে, MacPaw-এর সাইবারসিকিউরিটি বিভাগ মুনলক অ্যাপল কম্পিউটারে ম্যালওয়্যার ছড়িয়ে দেওয়ার জন্য AMOS চুরিকারী বিশ্বস্ত ব্র্যান্ডের জাল ওয়েবসাইটের উপর নির্ভর করে। তারা কেবল আমাদের ডিভাইসগুলিকে সংক্রামিত করে না, তারা ক্ষতিকারক উদ্দেশ্যে ভিকটিমদের শংসাপত্রও সংগ্রহ করে৷ জালিয়াতি করা ওয়েবসাইটগুলি বিপজ্জনক, তাই আমার দল এবং আমি তাদের সম্পর্কে কিছু করার সিদ্ধান্ত নিয়েছি। গণনা করা রিপোর্ট আমি নীচে যে সমাধানটি বর্ণনা করছি তা ধারণার প্রমাণ পরীক্ষা হিসাবে শুরু হয়েছে . আমরা MacPaw-এর টেকনোলজিকাল R&D-এ রিঙ্কেলগুলিকে ইস্ত্রি করেছি এবং STAST 2024-এ কার্যকরী প্রোটোটাইপ উপস্থাপন করেছি। আমাদের অবস্থানের কাগজে সমাধানটি বিশদভাবে বর্ণনা করা হয়েছে এবং মূলত আপলোড করা হয়েছিল . আমাদের অ্যান্টিফিশিং অ্যাপের হুডের নিচে এক ঝলক দেখার জন্য, অনুগ্রহ করে পড়ুন। মুনলক arXiv.org এখন আমাদের হাতে কী আছে? বর্তমান অ্যান্টিফিশিং অ্যাপ্লিকেশানগুলি প্রাথমিকভাবে তিনটি সনাক্তকরণ পদ্ধতি ব্যবহার করে: কালো তালিকাভুক্ত করা, শ্রেণিবিন্যাস-ভিত্তিক পদ্ধতি এবং রেফারেন্স-ভিত্তিক পদ্ধতি। প্রতিটি পদ্ধতির তার সুবিধা রয়েছে, তবে সকলের আরও উন্নতি প্রয়োজন। আসুন তাদের প্রতিটি অন্বেষণ করা যাক. কালো তালিকাভুক্ত করা ব্ল্যাকলিস্ট পদ্ধতি ব্যবহারিক এবং নির্ভুল, কিন্তু ফিশিং ওয়েবসাইটগুলি কত দ্রুত ছড়িয়ে পড়ে তা তা ধরে রাখতে পারে না। এটি সবসময় কার্যকর হয় না কারণ নতুন ফিশিং ওয়েবসাইটগুলিকে এখনও তালিকায় যোগ করার প্রয়োজন হতে পারে, যখন আক্রমণকারীরা প্রায়শই সনাক্তকরণকে ফাঁকি দিতে URL পরিবর্তন করে। উদাহরণস্বরূপ, Google নিরাপদ ব্রাউজিং পরিচিত ফিশিং সাইটের তালিকা ব্যবহার করে। আপনি যখন একটি ওয়েবসাইট দেখার চেষ্টা করেন, এটি এই তালিকার বিপরীতে ঠিকানা পরীক্ষা করে। কোনো মিল থাকলে, এটি অ্যাক্সেস ব্লক করে এবং বিপদ সম্পর্কে সতর্ক করে। কিন্তু ওয়েবসাইটটি কয়েক মিনিট আগে প্রকাশিত হলে কী হবে? এটি তালিকায় থাকবে না, এবং ব্যবহারকারী ফাঁদে পড়বে। শ্রেণিবিন্যাস-ভিত্তিক পদ্ধতি এই অ্যান্টিফিশিং পদ্ধতিতে, মেশিন লার্নিং ওয়েবপৃষ্ঠার বৈশিষ্ট্যগুলি যেমন URL স্ট্রাকচার, এইচটিএমএল কন্টেন্ট এবং মেটাডেটা বিশ্লেষণ করে একটি ওয়েবসাইট স্পুফ করা বা বৈধ কিনা তা নির্ধারণ করে। ব্রাউজার এক্সটেনশনের জন্য শ্রেণীবিভাগ চমৎকার কারণ এটি ব্যবহারকারীর ডেটা থেকে নতুন ফিশিং সাইট খুঁজে বের করতে শেখে। এখানে অসুবিধা হল যে মেশিন লার্নিংয়ের জন্য জটিল অ্যালগরিদম এবং প্রচুর প্রশিক্ষণ ডেটার প্রয়োজন হয়, যখন সাইবার অপরাধীরা সনাক্তকরণ এড়াতে দ্রুত নতুন অস্পষ্ট কৌশল উদ্ভাবন করে। এটি শ্রেণীবিভাগ-ভিত্তিক পদ্ধতিগুলিকে কম নির্ভুল করে তোলে এবং স্বতন্ত্র নিরাপত্তা পণ্যগুলির জন্য আদর্শ নয়। রেফারেন্স-ভিত্তিক পদ্ধতি রেফারেন্স-ভিত্তিক কিছু সমাধানকে অত্যাধুনিক বলে মনে করা হয়। তারা ওয়েবপৃষ্ঠার উপস্থিতি বিশ্লেষণ করতে এবং ফিশিং ওয়েবসাইটগুলিকে কার্যকরভাবে সনাক্ত করতে কম্পিউটার দৃষ্টি ব্যবহার করে। যাইহোক, আমরা যা দেখতে পাই তা হল রেফারেন্স-ভিত্তিক সমাধানগুলি দ্রুততর হতে পারে যদি তারা ক্লাউডে ফিশিং কেসগুলি প্রক্রিয়া না করে। একটি ফিশিং ওয়েবসাইট লাইভ হওয়া এবং রেফারেন্স-ভিত্তিক সনাক্তকরণ সিস্টেমের তালিকায় এটি যুক্ত করার মধ্যে একটি গুরুত্বপূর্ণ সময়ের ব্যবধান রয়েছে। দ্রুত সনাক্তকরণ এবং প্রতিক্রিয়া নিশ্চিত করতে আমরা এই ব্যবধানটি সঙ্কুচিত করতে চেয়েছিলাম। আমাদের নেটিভ macOS অ্যান্টিফিশিং অ্যাপ কীভাবে কাজ করে আমাদের লক্ষ্য ছিল ম্যাক ব্যবহারকারীদের লাইভ হওয়ার সাথে সাথে ফিশিং ওয়েবসাইট সম্পর্কে সতর্ক করা। এটি অর্জন করার জন্য, আমরা রেফারেন্স-ভিত্তিক পদ্ধতি গ্রহণ করেছি এবং এটি উন্নত করেছি। আমরা ক্লাউড প্রক্রিয়াকরণ বাদ দিয়েছি এবং সনাক্তকরণের সময় কমানোর লক্ষ্যে স্থানীয়ভাবে সমস্ত গণনা করার পরামর্শ দিয়েছি। বোনাস হিসাবে, আমাদের সমাধান গোপনীয়তা বাড়ায় যেহেতু সমস্ত ব্যবহারকারীর ডেটা ডিভাইসে প্রক্রিয়া করা হয় এবং অন্য কোথাও যায় না। আমরা সুইফট ব্যবহার করে একটি নেটিভ macOS অ্যাপ তৈরি করেছি, এর জন্য ফ্রেমওয়ার্ক অন্তর্ভুক্ত করে এবং মেশিন লার্নিং। আমাদের মডেল রূপান্তর করে বিন্যাস, আমরা মসৃণ কর্মক্ষমতা নিশ্চিত করেছি এবং সিস্টেম সম্পদের ব্যবহার কমিয়েছি। এইভাবে, আমাদের প্রোটোটাইপ ক্রমাগত ব্যাকগ্রাউন্ডে ওয়েবপৃষ্ঠাগুলি স্ক্যান করে, ম্যাক ব্যবহারকারীদের ফিশিং ওয়েবসাইটগুলি থেকে অতিরিক্ত ইন্টারঅ্যাকশনের প্রয়োজন ছাড়াই রক্ষা করে৷\ প্রোটোটাইপটি ব্রাউজার থেকে স্বাধীনভাবে কাজ করে৷ ম্যাকোস ফ্রেমওয়ার্ক এবং অ্যাক্সেসিবিলিটি মেটাডেটা অ্যাপটিকে আগ্রহের নির্দিষ্ট অঞ্চলগুলিতে ফোকাস করতে সহায়তা করে যাতে এটি ফিশিং কোথায় দেখতে হবে তা জানে৷ স্ক্রিন ক্যাপচারিং কোরএমএল অ্যাক্সেসযোগ্যতা সংক্ষেপে এটি কীভাবে কাজ করে তা এখানে। প্রথম ধাপ: ওয়েবপেজ বিশ্লেষণ যখন একটি ওয়েবসাইটে, আমাদের অ্যাপ পৃষ্ঠার বিন্যাস বোঝার চেষ্টা করে। এটি লোগো, ইনপুট ক্ষেত্র এবং বোতামগুলির মতো মূল পৃষ্ঠা উপাদানগুলি সনাক্ত করে৷ এই কাজের জন্য, আমরা বেছে নিয়েছি কারণ তার নির্ভুলতা এবং কর্মক্ষমতা. ResNet-50 এর সাথে DETR এই ধাপে, ওয়েবসাইটের উপাদানগুলির স্থান নির্ধারণ করা গুরুত্বপূর্ণ, বিশেষ করে একটি ব্র্যান্ড লোগো সহ এলাকা এবং শংসাপত্র প্রবেশের জন্য ফর্মগুলি। দ্বিতীয় ধাপ: ব্র্যান্ড অ্যাট্রিবিউশন এরপরে, প্রোটোটাইপ পরীক্ষা করে যে ওয়েবসাইটে একটি শনাক্ত করা লোগো কোনো সুপরিচিত ব্র্যান্ডের সাথে মেলে কিনা। এর উপরে, এটি বৈধ ওয়েবসাইটের একটি রেফারেন্স তালিকার সাথে ওয়েবপৃষ্ঠা URL-এর তুলনা করে। ওয়েবসাইটটি অফিসিয়াল হলে, আমরা পরবর্তী ধাপগুলি এড়িয়ে যাই। একটি সাইড নোটে, আমরা বিপণনের জন্য কতগুলি অফিসিয়াল ডোমেন ব্র্যান্ড ব্যবহার করে তা দেখে হতাশ হয়েছিলাম। এতে অবাক হওয়ার কিছু নেই যে ফিশিং ওয়েবসাইটগুলি তাদের শিকারদের প্রতারণার জন্য এত কার্যকর। উদাহরণস্বরূপ, DHL এর dhl.com, express.dhl, mydhli.com, dhlsameday.com এবং dhlexpresscommerce.com এর মতো বেশ কয়েকটি অফিসিয়াল ডোমেন রয়েছে। তৃতীয় ধাপ: শংসাপত্র সংগ্রহ প্রতিরোধ করুন আমরা ওয়েবপৃষ্ঠাটিকে দুটি বিভাগে শ্রেণীবদ্ধ করি: এটির শংসাপত্রের প্রয়োজন হোক বা না হোক। কোনো ফিশিং ওয়েবসাইট ব্যবহারকারীর ব্যক্তিগত তথ্য চুরি করার চেষ্টা করছে কিনা এই ধাপটি যাচাই করে। স্ক্রিনশটে, আমাদের প্রোটোটাইপ শংসাপত্রের ইনপুট ক্ষেত্রগুলি খুঁজে পেয়েছে, পৃষ্ঠাটিকে DHL-এর জন্য দায়ী করেছে এবং অফিসিয়াল DHL ডোমেনের তালিকার বিপরীতে URL চেক করেছে৷ ব্যবহারকারী একটি ফিশিং সতর্কতা পেয়েছেন যেহেতু পৃষ্ঠাটি DHL-এর অন্তর্গত নয়৷ প্রোটোটাইপ কতটা সঠিক? আমাদের সিস্টেম বেসলাইন নির্ভুলতা বজায় রাখে বা অতিক্রম করে এবং নিশ্চিতভাবে দ্রুত প্রক্রিয়াকরণের সময় রয়েছে। আমরা লোগো শনাক্তকরণে 90.8% নির্ভুলতা এবং শংসাপত্রের ইনপুট সনাক্তকরণে 98.1% নির্ভুলতা অর্জন করেছি। নীচের গ্রাফটি অন্যান্য অ্যান্টিফিশিং সমাধানগুলির বিরুদ্ধে আমাদের কর্মক্ষমতা প্রদর্শন করে এবং আমরা কীভাবে নির্ভুলতা, স্মরণ এবং মিথ্যা ইতিবাচক হারে তুলনা করি। আমরা গর্বিতভাবে 87.7% ফিশিং প্রচেষ্টা সনাক্ত করেছি যখন মিথ্যা পজিটিভ রেট কম 3.4% এ রেখেছি। এটা দ্রুত এবং মসৃণ, খুব চূড়ান্ত মেট্রিকগুলি দেখায় যে আমাদের সমাধানটি কার্যকারিতার লক্ষণীয় ক্ষতি ছাড়াই পটভূমিতে মসৃণভাবে চলে। CPU-এর ব্যবহার ন্যূনতম: Apple M1 Mac-এ আটটি কোর সহ, আমাদের প্রোটোটাইপ উপলব্ধ 800% ক্ষমতার মাত্র 16% ব্যবহার করে। এই খরচের মাত্রা তিনটি সক্রিয় সাফারি ট্যাব বা একটি জুম কলের মতো। চূড়ান্ত চিন্তা বাজারে প্রচুর অ্যান্টিফিশিং অ্যাপ রয়েছে, তবে তাদের বেশিরভাগই বাহ্যিক সার্ভারে ডেটা প্রক্রিয়া করে। আমাদের প্রোটোটাইপ দেখায় যে আধুনিক কম্পিউটারে হার্ডওয়্যার আমাদের ডিভাইসে স্থানীয়ভাবে মেশিন লার্নিং মডেল আনতে দেয়। আমরা এগুলিকে ফিশিং-এর বিরুদ্ধে লড়াই করতে ব্যবহার করতে পারি এবং প্রক্রিয়াকরণের গতি এবং সিস্টেম সংস্থানগুলির ব্যবহার সম্পর্কে চিন্তা করতে পারি না। সৌভাগ্যবশত, অ্যাপল ইকোসিস্টেম অপ্টিমাইজেশনের জন্য ফ্রেমওয়ার্ক এবং টুল সরবরাহ করে। ইভান পেত্রুখা, ম্যাকপাও টেকনোলজিকাল R&D-এর সিনিয়র রিসার্চ ইঞ্জিনিয়ার, প্রাক্তন মুনলক। লেখক: