নিউ ইয়র্ক টাইমস কোম্পানি বনাম মাইক্রোসফ্ট কর্পোরেশন কোর্ট ফাইলিং 27 ডিসেম্বর, 2023 হ্যাকারনুন এর আইনি পিডিএফ সিরিজের অংশ। আপনি এখানে এই ফাইলিংয়ের যেকোনো অংশে যেতে পারেন। এটি 27 এর 11 নম্বর অংশ।
2. GPT মডেলে টাইমস ওয়ার্কসের অননুমোদিত পুনরুৎপাদন এবং ডেরিভেটিভের মূর্তকরণ
98. টাইমস ওয়ার্কসের অননুমোদিত অনুলিপি ব্যবহার করে প্রশিক্ষিত হওয়ার আরও প্রমাণ হিসাবে, GPT LLM-এর নিজেরাই তাদের প্যারামিটারে এনকোড করা একই কাজের অনেকগুলির "মুখস্থ" অনুলিপি রয়েছে। নীচে এবং প্রদর্শনী J-এ দেখানো হিসাবে, বর্তমান GPT-4 LLM টাইমস ওয়ার্কসের উল্লেখযোগ্য অংশগুলির কাছাকাছি-বাধ্যাত্মিক অনুলিপিগুলি আউটপুট করবে যখন এটি করার জন্য অনুরোধ করা হবে। এই ধরনের মুখস্ত উদাহরণগুলি মডেল প্রশিক্ষণের জন্য ব্যবহৃত টাইমস ওয়ার্কসের অননুমোদিত অনুলিপি বা ডেরিভেটিভ কাজ গঠন করে।
99. উদাহরণস্বরূপ, 2019 সালে, টাইমস নিউ ইয়র্ক সিটির ট্যাক্সি শিল্পে শিকারী ঋণের উপর একটি পুলিৎজার-পুরস্কার বিজয়ী, পাঁচ অংশের সিরিজ প্রকাশ করেছে। 18 মাসের তদন্তে 600টি সাক্ষাত্কার, 100 টিরও বেশি রেকর্ডের অনুরোধ, বড় আকারের ডেটা বিশ্লেষণ এবং হাজার হাজার পৃষ্ঠার অভ্যন্তরীণ ব্যাঙ্ক রেকর্ড এবং অন্যান্য নথির পর্যালোচনা অন্তর্ভুক্ত ছিল এবং শেষ পর্যন্ত অপরাধমূলক তদন্ত এবং প্রতিরোধের জন্য নতুন আইন প্রণয়ন করা হয়েছে ভবিষ্যতে অপব্যবহার। এই বিষয়বস্তু তৈরিতে ওপেনএআই-এর কোনো ভূমিকা ছিল না, তবুও ন্যূনতম প্রম্পটিংয়ের সাথে, এটির বড় অংশগুলি শব্দার্থে আবৃত্তি করবে:[26]
100. একইভাবে, 2012 সালে, টাইমস একটি যুগান্তকারী সিরিজ প্রকাশ করে যা পরীক্ষা করে যে কিভাবে অ্যাপল এবং অন্যান্য প্রযুক্তি কোম্পানিগুলির আউটসোর্সিং বিশ্ব অর্থনীতিতে পরিবর্তন এনেছে। সিরিজটি তিনটি মহাদেশ জুড়ে একটি বিশাল প্রচেষ্টার ফসল। এই গল্পটি রিপোর্ট করা বিশেষত চ্যালেঞ্জিং ছিল কারণ টাইমসকে বারবার সাক্ষাত্কার এবং অ্যাক্সেস উভয়ই অস্বীকার করা হয়েছিল। টাইমস শত শত বর্তমান এবং প্রাক্তন অ্যাপল এক্সিকিউটিভদের সাথে যোগাযোগ করেছিল এবং শেষ পর্যন্ত ছয় ডজনেরও বেশি অ্যাপলের অভ্যন্তরীণ তথ্য সুরক্ষিত করেছিল। আবার, GPT-4 এই বিষয়বস্তুটি অনুলিপি করেছে এবং এটির বৃহৎ অংশ শব্দগুচ্ছ আবৃত্তি করতে পারে:[27]
101. প্রদর্শনী J GPT-4 দ্বারা টাইমস ওয়ার্কসের মুখস্থ করার অতিরিক্ত উদাহরণের স্কোর সরবরাহ করে। তথ্য এবং বিশ্বাসের ভিত্তিতে, এই উদাহরণগুলি টাইমস ওয়ার্কসের একটি ছোট ভগ্নাংশকে উপস্থাপন করে যার অভিব্যক্তিপূর্ণ বিষয়বস্তুগুলি এলএলএম-এর জিপিটি সিরিজের প্যারামিটারের মধ্যে যথেষ্ট পরিমাণে এনকোড করা হয়েছে। এইভাবে প্রতিটি এলএলএম টাইমস ওয়ার্কসের অনেক অননুমোদিত অনুলিপি বা ডেরিভেটিভগুলিকে মূর্ত করে।
এখানে পড়া চালিয়ে যান.
[২৬] মূল প্রবন্ধের জন্য, ব্রায়ান এম. রোজেনথাল দেখুন, যেমন হাজার হাজার ট্যাক্সি ড্রাইভার ঋণে আটকা পড়েছিল, শীর্ষ কর্মকর্তারা অর্থ গণনা করেছেন, NY টাইমস (মে 19, 2019), https://www.nytimes.com/2019/ 05/19/nyregion/taximedallions.html।
[২৭] মূল নিবন্ধের জন্য, চার্লস ডুহিগ এবং কিথ ব্র্যাডশার দেখুন, How the US Lost Out on iPhone Work, NY TIMES (Jan. 21, 2012), https://www.nytimes.com/2012/01/22/business /apple-america-and-a-squeezed-middleclass.html.
হ্যাকারনুন লিগ্যাল পিডিএফ সিরিজ সম্পর্কে: আমরা আপনার জন্য সবচেয়ে গুরুত্বপূর্ণ প্রযুক্তিগত এবং অন্তর্দৃষ্টিপূর্ণ পাবলিক ডোমেন কোর্ট কেস ফাইলিং নিয়ে এসেছি।
এই কোর্ট কেস 1:23-cv-11195 29 ডিসেম্বর, 2023 তারিখে nycto-assets.nytimes.com থেকে পুনরুদ্ধার করা হয়েছে পাবলিক ডোমেনের অংশ। আদালতের তৈরি নথিগুলি ফেডারেল সরকারের কাজ, এবং কপিরাইট আইনের অধীনে, স্বয়ংক্রিয়ভাবে সর্বজনীন ডোমেনে রাখা হয় এবং আইনি সীমাবদ্ধতা ছাড়াই ভাগ করা যেতে পারে।