New York Times Company v. Microsoft Corporation 법원에 2023년 12월 27일 제출된 소송은 HackerNoon의 법적 PDF 시리즈 의 일부입니다. 여기에서 이 서류의 어느 부분으로든 이동할 수 있습니다. 27개 중 9번째 부분입니다.
2. GenAI 모델의 작동 방식
75. 피고인의 GenAI 제품의 핵심은 "대형 언어 모델" 또는 "LLM"이라고 불리는 컴퓨터 프로그램입니다. 다양한 버전의 GPT가 LLM의 예입니다. LLM은 훈련에 사용된 잠재적으로 수십억 개의 예제를 기반으로 주어진 텍스트 문자열을 따를 가능성이 있는 단어를 예측하는 방식으로 작동합니다.
76. LLM의 출력을 입력에 추가하고 이를 모델에 다시 공급하면 단어별로 문장과 단락이 생성됩니다. 이것이 ChatGPT와 Bing Chat이 사용자 쿼리 또는 "프롬프트"에 대한 응답을 생성하는 방법입니다.
77. LLM은 이러한 예측을 수행하는 데 사용하는 훈련 코퍼스의 정보를 "매개변수"라는 숫자로 인코딩합니다. GPT-4 LLM에는 약 1조 7600억 개의 매개변수가 있습니다.
78. LLM의 매개변수 값을 설정하는 과정을 "훈련"이라고 합니다. 여기에는 훈련 작업의 인코딩된 복사본을 컴퓨터 메모리에 저장하고, 단어를 마스킹한 모델을 통해 반복적으로 전달하고, 마스킹된 단어와 모델이 예측하는 단어 사이의 차이를 최소화하도록 매개변수를 조정하는 작업이 포함됩니다.
79. 일반 말뭉치에 대해 훈련을 받은 후 모델은 예를 들어 내용이나 스타일을 더 잘 모방하기 위해 특정 유형의 작품을 사용하여 추가 훈련을 수행하거나 인간 피드백을 제공하여 강화하는 등의 "미세 조정"을 받을 수 있습니다. 원하지 않는 행동을 원하거나 억제합니다.
80. 이러한 방식으로 훈련된 모델은 "기억"이라는 동작을 나타내는 것으로 알려져 있습니다.[10] 즉, 올바른 프롬프트가 주어지면 훈련된 자료의 많은 부분을 반복합니다. 이 현상은 LLM 매개변수가 많은 훈련 작업의 검색 가능한 복사본을 인코딩한다는 것을 보여줍니다.
81. 교육을 받은 후에 LLM은 출력을 "접지"하기 위해 사용 사례 또는 주제에 특정한 정보를 제공받을 수 있습니다. 예를 들어, LLM은 컨텍스트로 제공되는 문서와 같은 특정 외부 데이터를 기반으로 텍스트 출력을 생성하도록 요청받을 수 있습니다. 이 방법을 사용하여 피고의 합성 검색 애플리케이션은 (1) 질문과 같은 입력을 받습니다. (2) 응답을 생성하기 전에 입력과 관련된 관련 문서를 검색합니다. (3) 맥락을 제공하기 위해 원본 입력을 검색된 문서와 결합합니다. (4) 결합된 데이터를 LLM에 제공하여 자연어 응답을 생성합니다.[11] 이렇게 생성된 검색 결과는 아래와 같이 모델 자체가 기억하지 못하는 작품을 광범위하게 복사하거나 유사하게 의역한 것일 수 있습니다.
여기에서 계속 읽으세요.
[11] Ben Ufuk Tezcan, 정보와 상호 작용하는 방법: 검색의 새로운 시대, MICROSOFT(2023년 9월 19일), https://azure.microsoft.com/en-us/blog/how-we-interact- 정보-새로운-검색 시대/.
HackerNoon 법률 PDF 시리즈 정보: 가장 중요한 기술적이고 통찰력 있는 공개 도메인 법원 소송 서류를 제공합니다.
nycto-assets.nytimes.com 에서 2023년 12월 29일에 검색된 이 법원 사건 1:23-cv-11195는 공개 도메인의 일부입니다. 법원이 작성한 문서는 연방 정부의 저작물이며 저작권법에 따라 자동으로 공개 도메인에 배치되며 법적 제한 없이 공유될 수 있습니다.