paint-brush
সমস্ত ডিপফেক ডিটেক্টর সমান তৈরি করা হয় নাদ্বারা@sumsub
6,187 পড়া
6,187 পড়া

সমস্ত ডিপফেক ডিটেক্টর সমান তৈরি করা হয় না

দ্বারা Sumsub11m2023/11/28
Read on Terminal Reader

অতিদীর্ঘ; পড়তে

Sumsub গত কয়েক বছরে ডিপফেক ডিটেক্টরের সক্ষমতা এবং অগ্রগতি সম্পর্কে একটি বাস্তবতা যাচাই করে।
featured image - সমস্ত ডিপফেক ডিটেক্টর সমান তৈরি করা হয় না
Sumsub HackerNoon profile picture

ডিপফেকগুলি গত কয়েক বছর ধরে বৃদ্ধি পাচ্ছে, একাধিক মুখ অদলবদল সরঞ্জাম প্রতারক এবং এমনকি সংগঠিত অপরাধী গোষ্ঠীগুলির মধ্যে জনপ্রিয়তা অর্জন করছে৷


ইউরোপোল রিপোর্ট অনুযায়ী " বাস্তবতার মুখোমুখি? আইন প্রয়োগকারী এবং ডিপফেকের চ্যালেঞ্জ ,” ডিপফেকগুলি আরও গুরুতর অপরাধ যেমন সিইও জালিয়াতি, প্রমাণ টেম্পারিং এবং অ-সম্মতিমূলক পর্নোগ্রাফি তৈরিতে ব্যবহার করা যেতে পারে।


যাইহোক, AI এর সাথে সম্পর্কিত সবকিছুর মতো, এটি সর্বদা প্রতারক এবং আধুনিক ডিপফেক ডিটেক্টরদের মধ্যে একটি অস্ত্রের প্রতিযোগিতা। আন্তর্জাতিক জালিয়াতি সচেতনতা সপ্তাহ থেকে বেরিয়ে এসে, আমরা গত কয়েক বছরে ডিপফেক ডিটেক্টরগুলির সক্ষমতা এবং অগ্রগতি সম্পর্কে একটি বাস্তবতা যাচাই করতে চেয়েছিলাম - একটি বাস্তবতা যাচাই করা প্রয়োজন শুধুমাত্র এই কারণে যে ডিপফেক জালিয়াতি এখনও কতটা বিশাল।


আমাদের অভ্যন্তরীণ গবেষণায়, আমরা 2020 সাল থেকে প্রকাশিত ওপেন-সোর্স আধুনিক অত্যাধুনিক ডিপফেক ডিটেক্টরগুলির কার্যকারিতা বিশ্লেষণ করেছি।


এখানে আমাদের মৌলিক পর্যবেক্ষণ: আসল এবং নকল বিষয়বস্তুর মধ্যে পার্থক্য করার ক্ষেত্রে, কম্পিউটারগুলি দীর্ঘকাল ধরে মানুষের চেয়ে এগিয়ে আছে। এই অনুসন্ধানটি অত্যাধুনিক অ্যালগরিদম এবং পদ্ধতিগুলির শক্তিকে কাজে লাগানোর প্রয়োজনীয়তার উপর জোর দেয়।


এই ক্ষেত্রের প্রায় সমস্ত নেতৃস্থানীয় কাজগুলি তাদের অ্যালগরিদমের একটি মৌলিক উপাদান হিসাবে মুখ সনাক্তকরণকে বিশিষ্টভাবে বৈশিষ্ট্যযুক্ত করে। মুখ সনাক্তকরণ একটি কাছাকাছি সমাধান, যা উচ্চ নির্ভুলতা দ্বারা চিহ্নিত করা হয়—নিখুঁত নয়, কিন্তু কাছাকাছি।


যখন একটি মুখ একটি ছবিতে বিশিষ্টভাবে অবস্থান করে এবং সামনের দিকে তাকায়, আধুনিক শনাক্তকরণ মডেলগুলি দ্রুত এবং নির্ভরযোগ্য সনাক্তকরণে উৎকর্ষ লাভ করে৷


এবং যখন ডিপফেক ছবি তৈরি করার বিভিন্ন উপায় রয়েছে, একটি পদ্ধতি জনপ্রিয় এবং শক্তিশালী উভয় হিসাবে দাঁড়িয়েছে: এক-শট ফেস সোয়াপিং। এই কৌশলটি দুটি চিত্র ব্যবহার করে, একটি উত্স এবং একটি লক্ষ্য, মুখের বৈশিষ্ট্যগুলিকে প্রাক্তন থেকে পরবর্তীতে স্থানান্তর করতে।


বর্তমান ল্যান্ডস্কেপে, এটিকে ডিপফেক ছবি এবং ভিডিও তৈরির সবচেয়ে শক্তিশালী পদ্ধতি হিসেবে বিবেচনা করা হয়।


আপনি আমাদের চেষ্টা করতে পারেন ডিপফেক খেলা নিজেকে, এবং এটি পরীক্ষা করে দেখুন।

অধ্যয়ন

বেশিরভাগ সম্পর্কিত কাজের মধ্যে সহজে উপলব্ধ কোড এবং ওজনের অভাব ডিপফেক সনাক্তকরণের ক্ষেত্রে একটি সাধারণ চ্যালেঞ্জকে আন্ডারস্কোর করে।


এই ল্যান্ডস্কেপটি প্রায়শই বৈজ্ঞানিক প্রচারের চেয়ে ব্যবসায়িক অ্যাপ্লিকেশনকে অগ্রাধিকার দেয়, যার ফলে একাডেমিক এবং গবেষণা সম্প্রদায়ের জন্য প্রয়োজনীয় সরঞ্জাম এবং সংস্থানগুলিতে সীমিত অ্যাক্সেস পাওয়া যায়।


খোলাখুলিভাবে ভাগ করা কোড এবং মডেল ওজনের এই অভাব ডিপফেক সনাক্তকরণ পদ্ধতির বিস্তৃত অগ্রগতির ক্ষেত্রে একটি উল্লেখযোগ্য বাধা হয়ে দাঁড়িয়েছে।


ডিপফেক সনাক্তকরণের জন্য অসংখ্য পদ্ধতি রয়েছে এবং প্রতিটি সম্মেলনের সাথে নতুন নিবন্ধগুলি উপস্থিত হয়৷


এই নিবন্ধগুলির মধ্যে কয়েকটি প্রাথমিকভাবে ডিপফেক সনাক্তকরণের জন্য মডেল আর্কিটেকচারের উপর ফোকাস করে, ট্রান্সফরমার মডেল থেকে যথেষ্ট অনুপ্রেরণা আঁকতে এবং এটিকে চ্যালেঞ্জের সাথে খাপ খাইয়ে নেওয়ার চেষ্টা করে।


ইতিমধ্যে, অন্যান্য নিবন্ধগুলি প্রশিক্ষণের পদ্ধতিগুলির উপর ফোকাস করে, বিশেষ করে জাল চিত্রে ভরা সিন্থেটিক ডেটাসেটের উপর। ক্ষেত্রটি মানদণ্ডে সমৃদ্ধ, এবং নিম্নলিখিত বিভাগে, আমরা ওপেন-সোর্স কোড এবং উপলব্ধ ওজনগুলির উপর জোর দিয়ে তাদের মধ্যে সবচেয়ে শক্তিশালী কিছু নিয়ে আলোচনা করব।

ফেসফরেন্সিক++



সমস্ত আধুনিক ডিপফেক সনাক্তকরণ পদ্ধতির জন্য সবচেয়ে বিশিষ্ট বেসলাইন হল গবেষণাপত্রে প্রকাশিত গবেষণা ফেসফরেন্সিক্স++: ম্যানিপুলেটেড ফেসিয়াল ইমেজ সনাক্ত করতে শেখা . লেখকদের প্রাথমিক অবদান হল 1000টি YouTube ভিডিও থেকে 1.8 মিলিয়নেরও বেশি ছবির একটি বিস্তৃত ডেটাসেট, যা কাঁচা, উচ্চ-মানের এবং নিম্ন-মানের বিকল্পগুলিতে শ্রেণীবদ্ধ।


তারা এই পার্থক্যগুলি যাচাই করার জন্য মানব পর্যবেক্ষকদের ব্যবহার করেছিল। কাগজে ডিপফেক শ্রেণিবিন্যাস মডেলটি একটি বাইনারি সিস্টেম যা ইমেজনেট ওজন সহ একটি XceptionNet ব্যাকবোনের উপর ভিত্তি করে, তাদের ডেটাসেটে সূক্ষ্ম সুর করা হয়েছে।


মডেলের প্রতিক্রিয়াগুলির উপর ভিত্তি করে একটি সাধারণ ভোটিং পদ্ধতি ব্যবহার করে, লেখকরা মডেলের স্থাপত্য সরলতা সত্ত্বেও ডিপফেক সনাক্তকরণের ক্ষেত্রে একটি উল্লেখযোগ্য প্রভাব অর্জন করেছেন।


একাধিক মনোযোগ ডিপফেক সনাক্তকরণ


লেখকরা পূর্ববর্তী ডিপফেক সনাক্তকরণ মডেলগুলিতে একটি সাধারণ সমস্যা হাইলাইট করেছেন যা প্রাথমিকভাবে একটি সাধারণ বাইনারি শ্রেণিবদ্ধ পদ্ধতির উপর তাদের নির্ভরতার দ্বারা চিহ্নিত করা হয়।


মৌলিক বাইনারি ক্লাসিফায়ার পদ্ধতি যা বাস্তব এবং নকল ছবির মধ্যে সূক্ষ্ম পার্থক্যের জন্য অ্যাকাউন্ট করে না। এখানে লেখকরা বিভিন্ন আর্টিফ্যাক্ট অঞ্চলে ফোকাস করার জন্য একাধিক মনোযোগ প্রধান সহ একটি মাল্টি-অ্যাটেনশন নেটওয়ার্ক ব্যবহার করে সূক্ষ্ম শ্রেণীবিভাগ দ্বারা অনুপ্রাণিত একটি বিকল্প প্রস্তাব করেছেন।


এই নেটওয়ার্কটি চিত্র উপস্থাপনা তৈরি করতে নিম্ন-স্তরের টেক্সচার বৈশিষ্ট্য এবং উচ্চ-স্তরের শব্দার্থিক বৈশিষ্ট্যগুলিকে একত্রিত করে এবং প্রশিক্ষণের জন্য একটি স্বতন্ত্র মনোযোগ-নির্দেশিত ডেটা বৃদ্ধি প্রক্রিয়া তৈরি করে।


এই পদ্ধতিটি বিদ্যমান মডেলগুলির সীমাবদ্ধতাগুলিকে সম্বোধন করে, এটিকে ডিপফেক সনাক্তকরণের জন্য একটি প্রতিশ্রুতিশীল পদ্ধতিতে পরিণত করে৷

ডিপফেক সনাক্তকরণের জন্য মাল্টি-মডেল মাল্টি-স্কেল ট্রান্সফরমার

"M2TR এর লেখক: ডিপফেক সনাক্তকরণের জন্য মাল্টি-মডেল মাল্টি-স্কেল ট্রান্সফরমার " ছবিগুলিতে নির্দিষ্ট অঞ্চলগুলিতে ফোকাস করার গুরুত্বের উপর জোর দিন যেখানে জাল সামগ্রী প্রদর্শিত হতে পারে৷


তারা একটি মাল্টি-স্কেল কাঠামোর সাথে একটি মাল্টি-মডেল পদ্ধতির প্রবর্তন করে, একটি ফ্রিকোয়েন্সি ফিল্টার ব্যবহার করে আর্টিফ্যাক্টগুলি সনাক্ত করতে যা কম্প্রেশনের পরে দৃশ্যমান নাও হতে পারে।


তারা আরও একটি ক্রস-মোডালিটি ফিউশন ব্লক নিযুক্ত করে স্ব-মনোযোগ দ্বারা অনুপ্রাণিত RGB এবং ফ্রিকোয়েন্সি বৈশিষ্ট্যগুলিকে একীভূত উপস্থাপনায় একত্রিত করতে, তাদের ডিপফেক সনাক্তকরণ পদ্ধতিকে উন্নত করে।


মুখ জালিয়াতি সনাক্তকরণের জন্য এন্ড-টু-এন্ড পুনর্গঠন-শ্রেণীবিভাগ শিক্ষা



ভিতরে " মুখ জালিয়াতি সনাক্তকরণের জন্য এন্ড-টু-এন্ড পুনর্গঠন-শ্রেণীবিভাগ শিক্ষা ," লেখকরা ডিপফেক সনাক্তকরণ পদ্ধতিতে একটি সাধারণ সমস্যাকে সম্বোধন করেন যা নির্দিষ্ট জালিয়াতি নিদর্শনগুলিতে ফোকাস করে, যা সমস্ত সম্ভাব্য ম্যানিপুলেশনকে অন্তর্ভুক্ত নাও করতে পারে৷


তারা দুটি উপাদানের উপর ভিত্তি করে একটি পদ্ধতির প্রস্তাব করে: পুনর্গঠন শিক্ষা এবং শ্রেণিবিন্যাস শিক্ষা:


  • পুনর্গঠন শিক্ষা অজানা জালিয়াতি নিদর্শন সনাক্ত করতে উপস্থাপনা উন্নত করে।


  • শ্রেণিবিন্যাস শিক্ষা বাস্তব এবং নকল ছবির মধ্যে বৈষম্য চিহ্নিত করে।


লেখকরা এই উপস্থাপনাগুলিকে উন্নত করার জন্য একটি বহু-স্কেল পদ্ধতি ব্যবহার করে, বাস্তব মুখের মডেলের জন্য একটি ডেডিকেটেড পুনর্গঠন নেটওয়ার্ক ব্যবহার করে এবং পূর্বে অজানা জালিয়াতি নিদর্শনগুলির সনাক্তকরণকে উন্নত করতে একটি মেট্রিক-লার্নিং ক্ষতি ব্যবহার করে।

অন্তর্নিহিত পরিচয় ফাঁস: ডিপফেক সনাক্তকরণের সাধারণীকরণের উন্নতিতে হোঁচট খাওয়ার বাধা

কাজের মধ্যে, " অন্তর্নিহিত পরিচয় ফাঁস: ডিপফেক সনাক্তকরণের সাধারণীকরণের উন্নতিতে হোঁচট খাওয়ার বাধা "লেখকরা ডিপফেক সনাক্তকরণ সংক্রান্ত একটি উল্লেখযোগ্য সমস্যাকে সম্বোধন করেছেন৷ তারা উল্লেখ করেছেন যে অনেক ডিপফেক মডেলগুলি ফেস-সোয়াপিং কৌশলগুলির উপর ভিত্তি করে, যা একটি অনন্য চ্যালেঞ্জের দিকে নিয়ে যেতে পারে৷


এই মডেলগুলি প্রকৃত আইডিগুলির বিতরণগুলি মনে রাখে, যার অর্থ হল একটি জাল ছবি কখনও কখনও দুটি ভিন্ন আইডির মিশ্রণ হিসাবে উপস্থিত হতে পারে৷ যাইহোক, নতুন, অদেখা বা ক্রস ডেটাসেটে এই মডেলগুলি প্রয়োগ করার চেষ্টা করার সময় এই সমস্যাটি বিশেষত চ্যালেঞ্জিং হয়ে ওঠে। এই ক্ষেত্রে, মডেলটি চিত্রটির প্রকৃত পরিচয় বোঝার জন্য সংগ্রাম করে কারণ এটি আগে এটির মুখোমুখি হয়নি।


এই সমস্যাটির সমাধান করার জন্য, যা লেখকরা "ইমপ্লিসিট আইডেন্টিটি লিকেজ" হিসাবে উল্লেখ করেছেন, তারা এমন সমাধান খুঁজে বের করার চেষ্টা করে যা তাদের প্রশিক্ষণ ডেটাসেটের সীমার বাইরে ডিপফেক সনাক্তকরণ মডেলগুলির সাধারণীকরণকে উন্নত করে।


এই ঘটনার প্রমাণ দেওয়ার জন্য, লেখকরা প্রাথমিকভাবে প্রশিক্ষিত ডিপফেক ক্লাসিফায়ারগুলি নিয়েছিলেন এবং শেষটি ব্যতীত সমস্ত স্তরগুলিকে হিমায়িত করেছিলেন৷ তারা শেষ স্তরটিকে একটি রৈখিক স্তর দিয়ে প্রতিস্থাপিত করেছে এবং একটি আইডি শ্রেণিবিন্যাসের কাজের জন্য এটিকে সূক্ষ্ম সুর করেছে।


এই পরীক্ষাটি দেখিয়েছে যে একটি একক রৈখিক স্তরকে কার্যকরভাবে আইডিগুলিকে উচ্চ নির্ভুলতার সাথে শ্রেণীবদ্ধ করতে প্রশিক্ষিত করা যেতে পারে, যা পরিচয় ফাঁসের সম্ভাবনা প্রদর্শন করে। তারপরে লেখকরা মুখের অংশগুলিকে বিভিন্ন স্কেলে অদলবদল করার জন্য একটি নতুন পদ্ধতি তৈরি করেছিলেন, বিশেষ মুখের অঞ্চলগুলি অদলবদল করার উপর প্রাথমিক ফোকাস দিয়ে।


তারপরে তারা এই প্রক্রিয়া থেকে উত্পন্ন চিত্রগুলি ব্যবহার করে একটি মাল্টি-স্কেল সনাক্তকরণ মডেলকে প্রশিক্ষণ দেয়। এই মডেলটি আর্টিফ্যাক্ট এলাকার অস্তিত্ব সনাক্ত করতে বিভিন্ন স্তরে বিভিন্ন আকারের বৈশিষ্ট্য মানচিত্রগুলি যাচাই করে, ডিপফেক ম্যানিপুলেশনের সম্ভাব্য সংকেতগুলির একটি পুঙ্খানুপুঙ্খ পর্যবেক্ষণ প্রদান করে।


স্ব-মিশ্রিত চিত্রগুলির সাথে ডিপফেকগুলি সনাক্ত করা


ডিপফেক সনাক্তকরণের ক্ষেত্রে সর্বশেষ উল্লেখযোগ্য কাগজ হল " স্ব-মিশ্রিত চিত্রগুলির সাথে ডিপফেকগুলি সনাক্ত করা এই গবেষণায়, লেখকরা একটি অনন্য ডেটাসেট ব্যবহার করে তাদের নিজস্ব মডেলকে প্রশিক্ষণ দিয়ে একটি অভিনব পদ্ধতি গ্রহণ করেছেন।


এই ডেটাসেটে ছদ্ম উৎসের মিশ্রণের মাধ্যমে তৈরি করা ছবি এবং স্বতন্ত্র আদিম ছবি থেকে প্রাপ্ত টার্গেট ইমেজ রয়েছে। এই প্রক্রিয়াটি কার্যকরভাবে সাধারণ জালিয়াতি শিল্পকর্মগুলিকে প্রতিলিপি করে যা প্রায়শই ডিপফেকগুলিতে দেখা যায়।

এই পদ্ধতির পিছনে মূল অন্তর্দৃষ্টি হল যে আরও সাধারণ এবং কম সহজে স্বীকৃত জাল নমুনাগুলি ব্যবহার করে, শ্রেণীবিভাগকারীরা ম্যানিপুলেশন-নির্দিষ্ট নিদর্শনগুলির অতিরিক্ত ফিটিং না করে আরও সাধারণ এবং শক্তিশালী উপস্থাপনা শিখতে পারে।


লেখকরা চারটি প্রাথমিক ধরনের সাধারণ ডিপফেক আর্টিফ্যাক্ট সনাক্ত করেছেন: ল্যান্ডমার্ক অমিল, মিশ্রিত সীমানা, রঙের অমিল এবং ফ্রিকোয়েন্সি অসঙ্গতি। তারপরে তারা একটি বিশেষ মডেল ব্যবহার করে এই নিদর্শনগুলিকে সংশ্লেষিত করে।


মডেল আর্কিটেকচারের জন্য, লেখক EfficientNet-b4 নিয়েছেন, ইমেজনেট ডেটাসেটে প্রাক-প্রশিক্ষিত। তারা তাদের সেলফ-ব্লেন্ডেড ইমেজ (SBI) ডেটাসেটে এই মডেলটিকে ফাইন-টিউন করে, নিশ্চিত করে যে মডেলটি সাধারণ জালিয়াতি আর্টিফ্যাক্টগুলির সাথে এই মিশ্রিত চিত্রগুলি থেকে শিখে ডিপফেকগুলি সনাক্ত করতে পারদর্শী হয়ে ওঠে।

আমাদের পরীক্ষা. মেট্রিক্স এবং ডেটাসেট

আমরা আধুনিক অত্যাধুনিক ডিপফেক ডিটেক্টরগুলির কার্যকারিতা বিশ্লেষণ করেছি যা 2020 এর পরে প্রকাশিত হয়েছিল এবং তাদের কোড এবং মডেলের ওজন জনসাধারণের এবং গবেষণা ব্যবহারের জন্য উপলব্ধ রয়েছে।


আমরা একই পাবলিক ডেটাসেটে প্রতিটি মডেলের জন্য প্রাসঙ্গিক মেট্রিক্স গণনা করেছি কিভাবে লেখকদের দ্বারা প্রকাশ করা গুণাবলী একই ডেটাসেটে স্থানান্তর করা হয়। তারপরে আমরা সাধারণ রূপান্তরগুলি প্রয়োগ করেছি যা প্রতারকরা প্রায়শই যাচাইকরণকে বাইপাস করতে ব্যবহার করে (যেমন ফেস সোয়াপ) এবং দেখেছি যে ডিপফেক ডিটেক্টরগুলি কতটা দক্ষতার সাথে কাজ করে৷


আমরা ব্যবহার করেছি Celeba-HQ এবং এলএফডব্লিউ গ্রাউন্ড ট্রুথ রিয়েল ইমেজের জন্য বেস ডেটাসেট হিসেবে। উভয়ই গবেষণা এবং উন্নয়নে ব্যাপকভাবে ব্যবহৃত হয়। এই দুটি ডেটাসেটের ছবিগুলিকে বেশিরভাগ কম্পিউটার ভিশন কাজের জন্য "ডোমেন" ইমেজ হিসাবে শ্রেণীবদ্ধ করা যেতে পারে।


একটি গ্রাউন্ড ট্রুথ ফেক ইমেজ ডেটাসেট প্রবর্তন করতে, আমরা একটি অত্যাধুনিক ব্যবহার করেছি 2021 সালের deepfake মডেলটিকে SimSwap বলা হয় . এটি এখনও অনেকের দ্বারা সেরা এবং সর্বাধিক জনপ্রিয় একক-ফটো ডিপফেক জেনারেটর হিসাবে বিবেচিত হয়।


পর্যাপ্ত পরিমাণ ছবি তৈরি করতে, আমরা ফেক-সেলেবা-এইচকিউ এবং ফেক-এলএফডব্লিউ তৈরি করতে ডেটাসেট থেকে উৎস এবং রেফারেন্স ফটোগুলির র্যান্ডম জোড়া ব্যবহার করেছি। প্রতিটি ডেটাসেট ঠিক 10.000 ছবি।


সরলতার জন্য, মডেলগুলির গুণমান পরিমাপের প্রধান মেট্রিক আমরা 0.5 এর ডিফল্ট থ্রেশহোল্ড সহ 1-শ্রেণীর নির্ভুলতা ব্যবহার করেছি। অন্য কথায়, প্রতিটি ডেটাসেটের জন্য, আমরা সঠিকভাবে অনুমান করা লেবেলের শতাংশ গণনা করেছি। উপরন্তু, আমরা সম্মিলিত বাস্তব এবং নকল ডেটাসেটের উপর মোট ROC-AUC মেট্রিক গণনা করি।

পরীক্ষা 1:


এলএফডব্লিউ

সেলিবাএইচকিউ

জাল-LFW

জাল-সেলেবাএইচকিউ

AUC স্কোর

এসবিআই

0.82

0.57

0.82

0.96

0.84

CADDM

0.49

0.69

0.80

0.54

0.67

RECCE

0.01

0.00

0.98

0.00

0.54

MAT

0.00

0.74

1.

1.

0.75

FF++

0.13

0.67

0.88

0.53

0.57

M2TR

0.42

0.56

0.69

0.51

0.56

সারণী 1. পরিবর্তন ছাড়াই আসল/নকল ডেটাসেটের জন্য 1-শ্রেণীর নির্ভুলতা এবং AUC


প্রত্যাশিত হিসাবে, বেশিরভাগ মডেলের SimSwap deepfakes সনাক্ত করতে কিছু সমস্যা ছিল। সেরা মডেল হল SBI, স্কোর 82% এবং 96% যা একটি প্রতিশ্রুতিশীল 0.84 AUC স্কোর দেখাচ্ছে।


যা অপ্রত্যাশিত তা হল এমন অনেকগুলি সক্ষম মডেল রয়েছে যেগুলি বাস্তব ডেটাসেট থেকে চিত্রগুলিকে বাস্তব হিসাবে শ্রেণীবদ্ধ করতে অসুবিধা হয়েছিল:


  • RECCE বেশিরভাগ আসল ছবিকে নকল হিসেবে স্কোর করেছে।


  • MAT, FF, এবং M2TR ডিপফেক হিসাবে LFW থেকে অর্ধেকেরও কম মুখ স্কোর করেছে।


0.5 এর কাছাকাছি AUC স্কোর আছে এমন 3টি মডেল রয়েছে৷ এটি আরও বাস্তবসম্মত ডোমেনে এই মডেলগুলির স্থানান্তরযোগ্যতা এবং কীভাবে সেগুলিকে প্রতারকদের দ্বারা সহজেই বাইপাস করা যায় সে সম্পর্কে প্রশ্ন উত্থাপন করে৷

পরীক্ষা 2:

এই মডেলগুলি আরও বাস্তবসম্মত ডোমেনে কীভাবে আচরণ করে তা পরীক্ষা করার জন্য, আমরা ডিপফেক ব্যবহার করার সময় প্রতারকরা সাধারণত দুটি ভিন্ন কৌশল ব্যবহার করার চেষ্টা করব।


বেশিরভাগ শিল্পকর্ম এবং অনিয়ম লুকানোর জন্য তারা প্রথমে যে কাজটি করে তা হল ডাউনস্কেলিং। যেহেতু, বেশিরভাগ লাইভেনেস এবং ডিপফেক চেকের ক্ষেত্রে ভিডিওর গুণমানের কোন প্রয়োজনীয়তা নেই, তাই প্রতারকরা সাধারণত ডিপফেক করা ভিডিও সংকুচিত করে।


এই পদ্ধতির অনুকরণ করার জন্য, আমরা একই ডেটাসেটগুলি ব্যবহার করব, তবে একটি দ্বি-রৈখিক অ্যালগরিদম ব্যবহার করে প্রতিটি চিত্রকে অনেক ছোট রেজোলিউশনে (128x128) সংকুচিত করব। আদর্শভাবে, ডিপফেক ডিটেক্টরগুলি ডিপফেকগুলি সনাক্ত করতে সক্ষম হওয়া উচিত, এমনকি যদি অনুমানে চিত্রগুলির রেজোলিউশন প্রশিক্ষণ প্রক্রিয়া চলাকালীন রেজোলিউশন থেকে আলাদা হয়।



এলএফডব্লিউ

সেলিবাএইচকিউ

জাল-LFW

জাল-সেলেবাএইচকিউ

AUC স্কোর

এসবিআই

0.82

0.82

0.43

0.23

0.6

CADDM

0.55

0.46

0.62

0.65

0.6

RECCE

0.83

0.89

0.13

0.08

0.54

MAT c40

1.

1.

0

0

0.5

চিত্র 2: নিম্নমানের ডেটাসেটে ডিপফেক ডিটেক্টরের সেরা মেট্রিক্স


এখানে, ফলাফল বিভ্রান্তিকর চেয়ে বেশি। যে মডেলগুলি কমবেশি প্রতিযোগিতামূলক পারফরম্যান্স অর্জন করছিল সেগুলি এখন জাল ডেটাসেটের প্রায় শূন্যের কাছাকাছি। কেউ দেখতে পারে যে MAT মডেলটি কেবল একটি বাস্তব চিত্র হিসাবে সবকিছু স্কোর করেছে, এবং RECCE মডেলটি একই সিদ্ধান্তের খুব কাছাকাছি।

পরীক্ষা 3:

দ্বিতীয় জালিয়াতির অভ্যাসটি হল ডিপফেক করা ছবিগুলিকে পুনরুদ্ধার করার জন্য ইমেজটিকে উন্নত করা যাতে সমস্ত অসম্পূর্ণতাগুলি দূর করা যায় যা ডিটেক্টরদের কাছে তৈরি করা ছবিগুলিকে "ত্যাগ" করতে পারে। এরকম অনেক উদাহরণের মধ্যে একটি হল চোখ: বেশিরভাগ ডিপফেক করা ছবিতে কোন গোলাকার পুতুল বা আলোর প্রতিসরণ নেই।


সুতরাং, একজন প্রতারক সাধারণত সমস্ত অমেধ্যকে মাস্ক করতে Instagram বা TikTok-এ ব্যবহৃত সফ্টওয়্যারগুলির মতো কিছু নির্দিষ্ট সৌন্দর্যায়ন বা "বর্ধিতকরণ" সফ্টওয়্যার ব্যবহার করে।


এই ধরনের সফ্টওয়্যারের প্রভাব অনুকরণ করতে, আমরা এটির ঘনিষ্ঠভাবে সম্পর্কিত ব্যবহার করেছি ওপেন সোর্স এনালগ: GPEN . এটি একটি বর্ধক যা মুখকে উন্নত করতে এবং এটিকে উন্নত করতে GAN ব্যবহার করে।



এলএফডব্লিউ

সেলিবাএইচকিউ

জাল-LFW

জাল-সেলেবাএইচকিউ

AUC স্কোর

এসবিআই

0.76

0.63

0.38

0.58

0.62

CADDM

0.52

0.71

0.59

0.38

0.57

RECCE

0.18

0

0.8

1.

0.52

MAT c40

0.99

1.

0

0

0.5

চিত্র 3: একটি উন্নত ডেটাসেটে ডিপফেক ডিটেক্টরের সেরা মেট্রিক্স


এখানে, কেউ পরীক্ষা 2-এর মতো একই প্রবণতা দেখতে পাচ্ছেন। MAT মডেলটি সবকিছুকে আসল হিসাবে স্কোর করেছে এবং RECCE সবকিছুকে জাল হিসাবে স্কোর করেছে। SBI এবং CADDM-এর কর্মক্ষমতা র‍্যান্ডম থেকে ভালো, কিন্তু তারা ফেক-এলএফডব্লিউ এবং ফেক-সেলেবা-এইচকিউ ডেটাসেটের অর্ধেকেরও বেশি ডিপফেক মিস করেছে।

উপসংহার

এই গবেষণার ফলাফল হতাশাজনক কারণ কোনো ওপেন সোর্স ডিপফেক ডিটেক্টর নেই যা 100% সুরক্ষিত হবে, যখন ডিপফেক জালিয়াতি আরও বিকাশ লাভ করবে বলে আশা করা হচ্ছে, কারণ এর প্রজন্ম সহজ এবং সস্তা হচ্ছে৷ Sumsub-এর অভ্যন্তরীণ পরিসংখ্যান অনুসারে, 2022 থেকে Q1 2023 পর্যন্ত ডিপফেক প্রতারণার প্রবণতা উল্লেখযোগ্যভাবে বৃদ্ধি পেয়েছে:


  • 2022 থেকে Q1 2023 পর্যন্ত, সমস্ত জালিয়াতির প্রকারের মধ্যে ডিপফেকের অনুপাত কানাডায় 4,500%, মার্কিন যুক্তরাষ্ট্রে 1,200%, জার্মানিতে 407% এবং যুক্তরাজ্যে 392% বৃদ্ধি পেয়েছে৷


  • 2023 সালের প্রথম প্রান্তিকে, সর্বাধিক ডিপফেকগুলি গ্রেট ব্রিটেন এবং স্পেন থেকে এসেছে যথাক্রমে 11.8% এবং 11.2% বৈশ্বিক ডিপফেক জালিয়াতি, তারপরে জার্মানি (6.7%) এবং নেদারল্যান্ডস (4.7%)৷ মার্কিন যুক্তরাষ্ট্র 5ম স্থানে রয়েছে, যা বিশ্বব্যাপী ডিপ ফেক জালিয়াতির ক্ষেত্রে 4.3% প্রতিনিধিত্ব করে।


আমাদের পরীক্ষাগুলি দেখায় যে ডিপফেক সনাক্তকরণ সম্পর্কে এখনও অনেক কিছু করা বাকি আছে৷ এমনকি সেরা ওপেন সোর্স ডিপফেক সনাক্তকরণ মডেলগুলি বাস্তব বিশ্বের জন্য প্রস্তুত নয় এবং প্রতারকদের বিরুদ্ধে লড়াই করতে পারে না৷


ডিপফেক ডিটেক্টর সম্পর্কে প্রচুর সংখ্যক কাগজপত্র রয়েছে, তবে তাদের বেশিরভাগের কোড বা মডেল ওজন উপলব্ধ নেই।


সেই কারণে, এখানে সমস্যাগুলির মধ্যে একটি হল খোলামেলাতার অভাব যা ডিপফেক সনাক্তকরণ পদ্ধতিগুলির উন্নতিতে বাধা তৈরি করে।


অতএব, আমরা Sumsub এ:


  • ডিপফেক এবং সিন্থেটিক জালিয়াতি সনাক্তকরণের জন্য আমাদের চারটি স্বতন্ত্র মেশিন লার্নিং-চালিত মডেলের ইন-হাউস সেট অফার করুন নকলের জন্য . এটি বিনামূল্যে ডাউনলোড এবং ব্যবহারের জন্য সকলের জন্য উপলব্ধ, এবং মডেলগুলির সক্ষমতা আরও উন্নত করতে Sumsub এআই-গবেষণা সম্প্রদায়ের কাছ থেকে প্রতিক্রিয়া চায়৷


তবুও, ইন্টারনেট ব্যবহারকারীদের ছবির অনলাইন সুরক্ষার মূল দায়িত্ব ব্যবহারকারীদের নিজেরাই। অনলাইনে ব্যক্তিগত ছবি শেয়ার করার ব্যাপারে সতর্ক থাকতে ভুলবেন না। এর পরিবর্তে স্টাইলিশ অবতার ব্যবহার করা ভালো, ঠিক আমাদের লেখকদের মতো।


এবং এখানে , আপনি কীভাবে ডিপফেক অপব্যবহার থেকে দূরে থাকবেন সে সম্পর্কে অন্যান্য দরকারী টিপস পেতে পারেন৷


লিখেছেন ম্যাকসিম আর্টেমেভ, লিড কম্পিউটার ভিশন ইঞ্জিনিয়ার, এবং স্লাভা পিরোগভ, কম্পিউটার ভিশন ইঞ্জিনিয়ার, সামসাবের


ম্যাকসিম আর্টেমেভ, লিড কম্পিউটার ভিশন ইঞ্জিনিয়ার, সুমসাবেরSlava Pirogov, Computer Vision Engineer, Sumsub-এ