paint-brush
দ্য টাইমস বনাম মাইক্রোসফট/ওপেনএআই: জিপিটি মডেলে টাইমস ওয়ার্কসের অননুমোদিত পুনরুৎপাদন (11)দ্বারা@legalpdf
185 পড়া

দ্য টাইমস বনাম মাইক্রোসফট/ওপেনএআই: জিপিটি মডেলে টাইমস ওয়ার্কসের অননুমোদিত পুনরুৎপাদন (11)

দ্বারা Legal PDF: Tech Court Cases3m2024/01/02
Read on Terminal Reader

অতিদীর্ঘ; পড়তে

টাইমস ওয়ার্কসের অননুমোদিত অনুলিপি ব্যবহার করে প্রশিক্ষিত হওয়ার আরও প্রমাণ হিসাবে, জিপিটি এলএলএম নিজেই একই কাজের এনকোডগুলির অনেকগুলি "মুখস্থ" অনুলিপি রয়েছে
featured image - দ্য টাইমস বনাম মাইক্রোসফট/ওপেনএআই: জিপিটি মডেলে টাইমস ওয়ার্কসের অননুমোদিত পুনরুৎপাদন (11)
Legal PDF: Tech Court Cases HackerNoon profile picture

নিউ ইয়র্ক টাইমস কোম্পানি বনাম মাইক্রোসফ্ট কর্পোরেশন কোর্ট ফাইলিং 27 ডিসেম্বর, 2023 হ্যাকারনুন এর আইনি পিডিএফ সিরিজের অংশ। আপনি এখানে এই ফাইলিংয়ের যেকোনো অংশে যেতে পারেন। এটি 27 এর 11 নম্বর অংশ।

IV বাস্তব অভিযোগ

C. বিবাদীদের অননুমোদিত ব্যবহার এবং টাইমস বিষয়বস্তুর অনুলিপি করা

2. GPT মডেলে টাইমস ওয়ার্কসের অননুমোদিত পুনরুৎপাদন এবং ডেরিভেটিভের মূর্তকরণ


98. টাইমস ওয়ার্কসের অননুমোদিত অনুলিপি ব্যবহার করে প্রশিক্ষিত হওয়ার আরও প্রমাণ হিসাবে, GPT LLM-এর নিজেরাই তাদের প্যারামিটারে এনকোড করা একই কাজের অনেকগুলির "মুখস্থ" অনুলিপি রয়েছে। নীচে এবং প্রদর্শনী J-এ দেখানো হিসাবে, বর্তমান GPT-4 LLM টাইমস ওয়ার্কসের উল্লেখযোগ্য অংশগুলির কাছাকাছি-বাধ্যাত্মিক অনুলিপিগুলি আউটপুট করবে যখন এটি করার জন্য অনুরোধ করা হবে। এই ধরনের মুখস্ত উদাহরণগুলি মডেল প্রশিক্ষণের জন্য ব্যবহৃত টাইমস ওয়ার্কসের অননুমোদিত অনুলিপি বা ডেরিভেটিভ কাজ গঠন করে।


99. উদাহরণস্বরূপ, 2019 সালে, টাইমস নিউ ইয়র্ক সিটির ট্যাক্সি শিল্পে শিকারী ঋণের উপর একটি পুলিৎজার-পুরস্কার বিজয়ী, পাঁচ অংশের সিরিজ প্রকাশ করেছে। 18 মাসের তদন্তে 600টি সাক্ষাত্কার, 100 টিরও বেশি রেকর্ডের অনুরোধ, বড় আকারের ডেটা বিশ্লেষণ এবং হাজার হাজার পৃষ্ঠার অভ্যন্তরীণ ব্যাঙ্ক রেকর্ড এবং অন্যান্য নথির পর্যালোচনা অন্তর্ভুক্ত ছিল এবং শেষ পর্যন্ত অপরাধমূলক তদন্ত এবং প্রতিরোধের জন্য নতুন আইন প্রণয়ন করা হয়েছে ভবিষ্যতে অপব্যবহার। এই বিষয়বস্তু তৈরিতে ওপেনএআই-এর কোনো ভূমিকা ছিল না, তবুও ন্যূনতম প্রম্পটিংয়ের সাথে, এটির বড় অংশগুলি শব্দার্থে আবৃত্তি করবে:[26]



5 এ J প্রদর্শন করুন।


100. একইভাবে, 2012 সালে, টাইমস একটি যুগান্তকারী সিরিজ প্রকাশ করে যা পরীক্ষা করে যে কিভাবে অ্যাপল এবং অন্যান্য প্রযুক্তি কোম্পানিগুলির আউটসোর্সিং বিশ্ব অর্থনীতিতে পরিবর্তন এনেছে। সিরিজটি তিনটি মহাদেশ জুড়ে একটি বিশাল প্রচেষ্টার ফসল। এই গল্পটি রিপোর্ট করা বিশেষত চ্যালেঞ্জিং ছিল কারণ টাইমসকে বারবার সাক্ষাত্কার এবং অ্যাক্সেস উভয়ই অস্বীকার করা হয়েছিল। টাইমস শত শত বর্তমান এবং প্রাক্তন অ্যাপল এক্সিকিউটিভদের সাথে যোগাযোগ করেছিল এবং শেষ পর্যন্ত ছয় ডজনেরও বেশি অ্যাপলের অভ্যন্তরীণ তথ্য সুরক্ষিত করেছিল। আবার, GPT-4 এই বিষয়বস্তুটি অনুলিপি করেছে এবং এটির বৃহৎ অংশ শব্দগুচ্ছ আবৃত্তি করতে পারে:[27]


3 এ প্রদর্শনী J.


101. প্রদর্শনী J GPT-4 দ্বারা টাইমস ওয়ার্কসের মুখস্থ করার অতিরিক্ত উদাহরণের স্কোর সরবরাহ করে। তথ্য এবং বিশ্বাসের ভিত্তিতে, এই উদাহরণগুলি টাইমস ওয়ার্কসের একটি ছোট ভগ্নাংশকে উপস্থাপন করে যার অভিব্যক্তিপূর্ণ বিষয়বস্তুগুলি এলএলএম-এর জিপিটি সিরিজের প্যারামিটারের মধ্যে যথেষ্ট পরিমাণে এনকোড করা হয়েছে। এইভাবে প্রতিটি এলএলএম টাইমস ওয়ার্কসের অনেক অননুমোদিত অনুলিপি বা ডেরিভেটিভগুলিকে মূর্ত করে।



এখানে পড়া চালিয়ে যান.


[২৬] মূল প্রবন্ধের জন্য, ব্রায়ান এম. রোজেনথাল দেখুন, যেমন হাজার হাজার ট্যাক্সি ড্রাইভার ঋণে আটকা পড়েছিল, শীর্ষ কর্মকর্তারা অর্থ গণনা করেছেন, NY টাইমস (মে 19, 2019), https://www.nytimes.com/2019/ 05/19/nyregion/taximedallions.html।


[২৭] মূল নিবন্ধের জন্য, চার্লস ডুহিগ এবং কিথ ব্র্যাডশার দেখুন, How the US Lost Out on iPhone Work, NY TIMES (Jan. 21, 2012), https://www.nytimes.com/2012/01/22/business /apple-america-and-a-squeezed-middleclass.html.




হ্যাকারনুন লিগ্যাল পিডিএফ সিরিজ সম্পর্কে: আমরা আপনার জন্য সবচেয়ে গুরুত্বপূর্ণ প্রযুক্তিগত এবং অন্তর্দৃষ্টিপূর্ণ পাবলিক ডোমেন কোর্ট কেস ফাইলিং নিয়ে এসেছি।


এই কোর্ট কেস 1:23-cv-11195 29 ডিসেম্বর, 2023 তারিখে nycto-assets.nytimes.com থেকে পুনরুদ্ধার করা হয়েছে পাবলিক ডোমেনের অংশ। আদালতের তৈরি নথিগুলি ফেডারেল সরকারের কাজ, এবং কপিরাইট আইনের অধীনে, স্বয়ংক্রিয়ভাবে সর্বজনীন ডোমেনে রাখা হয় এবং আইনি সীমাবদ্ধতা ছাড়াই ভাগ করা যেতে পারে।