우리는 2022년 11월 ChatGPT가 도입되면서 새로운 Generative AI 거대 기업인 OpenAI가 등장한 것을 확인했습니다. ChatGPT는 사용하는 기본 모델에 대한 채팅 중심 인터페이스 역할을 합니다. 챗봇의 첫 번째 버전은 GPT-3.5라는 대규모 언어 모델에 의존했는데, 이는 확실히 우리 모두를 놀라게 했습니다.
하지만 ChatGPT가 처음 출시된 지 4개월 후인 2023년 3월 14일 화요일, OpenAI는 이전 버전보다 더 강력한 모델인 GPT-4를 출시하며 박차를 가하고 있습니다. 처음에는 GPT-3.5와 협력하도록 설계된 챗봇은 이제 GPT-4와 상호 작용하는 매체로 작동합니다.
GPT-3.5가 할 수 있는 것과 동일하지만 그 이상입니다. 회사는 블로그 게시물에서 다음과 같이 말했습니다.
"GPT-4는 GPT-3.5보다 더 안정적이고 창의적이며 훨씬 더 미묘한 지침을 처리할 수 있습니다."
OpenAI는 2018년부터 GPT 언어 모델을 보급해 왔지만 모든 Open AI의 거대한 언어 모델 중에서 GPT-4는 최신일 뿐만 아니라 가장 강력합니다. OpenAI는 Microsoft Azure를 사용하여 모델을 훈련했다고 보고했습니다. GPT-4를 GPT-3.5와 비교하는 몇 가지 방법은 다음과 같습니다.
GPT-4는 시각적 입력을 허용하지만 GPT-3.5는 그렇지 않습니다.
OpenAI에서 지정한 대로 GPT-4가 "다중 모드"이고 정보의 많은 "양식"을 이해할 수 있다는 점을 고려하면 GPT-3.5는 본질적으로 텍스트를 읽고 쓸 수 있었던 반면 시각적 및 텍스트 단서 모두를 통해 콘텐츠를 생성하라는 메시지가 표시될 수 있습니다. . 그럼에도 불구하고 회사는 이미지 설명 기능을 즉시 배포하지 않고 있으며 GPT-4 버전은 OpenAI의 ChatGPT Plus 사용자 및 개발자 가입자에게만 제공되며 텍스트만 지원합니다.
GPT-3.5에 비해 GPT-4는 더 큰 버퍼를 가지고 있습니다.
간단히 말해서 GPT-4는 이전 모델보다 메모리가 더 길어졌습니다. GPT-3.5 및 이전 ChatGPT 반복을 사용하면 최대값은 4,096개의 "토큰" 또는 약 8,000단어인 반면, GPT-4의 최대 토큰 수는 32,768개 또는 약 64,000단어입니다. 이는 8배 더 많은 메모리 용량입니다.
GPT-4에는 다양한 "페르소나"가 있습니다. 또는 GPT-3.5와 달리 조종성
조종 가능성은 특정 방향이나 스타일로 언어 모델의 출력을 제어하거나 영향을 주는 능력을 의미합니다. 즉, 사용자는 특정 어조, 스타일 또는 주제에 맞는 텍스트를 생성하도록 언어 모델을 안내할 수 있습니다. GPT-3에는 조종 기능이 내장되어 있지 않지만 GPT-4에는 있습니다. GPT-4를 사용하면 개발자와 ChatGPT 사용자는 정의된 장황함, 어조 및 스타일이 있는 기존 ChatGPT 성격과 달리 "시스템" 메시지에 이러한 지시를 제공하여 AI의 스타일과 작업을 지정할 수 있습니다. 회사는 이 기능이 현재 개발자에게만 제공되지만 곧 ChatGPT 사용자에게도 제공될 것이라고 밝혔습니다.
GPT-4는 더 넓은 언어 범위를 가지고 있습니다.
이는 GPT-4가 이전 GPT-3.5보다 더 다양한 언어로 텍스트를 이해하고 생성할 수 있음을 의미합니다. 이는 자연어 처리 분야에서 획기적인 발전입니다. OpenAI에 따르면 GPT-4는 테스트한 26개 언어 중 24개 언어에서 GPT-3.5 및 기타 LLM의 영어 성능을 능가했습니다. 결과적으로 GPT-4는 26개 언어로 된 수많은 객관식 질문에 정확하게 응답할 수 있습니다.
GPT-4는 사실에 대한 '환각'이 적습니다.
환각이나 사실 구성을 완전히 막지는 못하더라도 GPT-4는 이전 변종에 비해 이러한 현상을 상당히 줄였습니다. 회사는 업데이트된 언어 모델이 GPT-3.5만큼 나쁘지는 않지만 계속해서 사실을 "환각"하고 결함 있는 논리를 보여준다고 말했습니다. 언어 모델 소프트웨어의 맥락에서 환각은 일관되고 의미 있는 것처럼 보이지만 실제로는 입력 데이터에서 지원되지 않는 텍스트의 생성을 의미합니다. 이는 언어 모델이 문맥에 근거하지 않거나 입력 텍스트의 의미론적 의미와 일치하지 않는 텍스트를 생성할 때 발생할 수 있습니다.
즉, 언어 모델은 훈련된 정보를 기반으로 정확하지 않거나 그럴듯하지 않은 텍스트를 생성할 수 있으며, 이로 인해 일반적으로 "환각"이라고 불리는 현상이 발생합니다. 이 모델에는 위의 제한 사항 외에도 사회적 편견과 적대적인 메시지도 포함되어 있습니다. OpenAI의 블로그 게시물에는 다음과 같이 명시되어 있습니다.
"GPT-4는 내부 적대적 사실성 평가에서 최신 GPT-3.5보다 40% 더 높은 점수를 받았습니다."
The Washington Post 에 따르면 LLM은 인터넷 텍스트와 영상에 대한 교육을 통해 인종, 성별, 종교, 계급에 대한 인간의 편견을 모방하는 방법을 배웠습니다. 분명히 AI 시스템은 사회의 기존 편견을 완화하는 데 도움이 되기보다는 이를 지속시키고 증폭시킬 수 있는 잠재력을 가지고 있습니다.
GPT-4에는 GPT-3.5에서 발견된 것과 유사한 추가 제한 사항도 있는데, 그 중 하나는 2021년 9월 이후에 발생한 사건에 대한 지식이 여전히 부족하다는 것입니다. 경험으로부터 배우지 않습니다. 그럼에도 불구하고 GPT-4는 여전히 더 똑똑합니다. 더 정확하고 정확하며 더 나은 전문성을 갖추고 있기 때문입니다.
언어 모델은 또한 시험에 합격할 수 있다는 것을 보여주었습니다. OpenAI에 따르면 모의 시험에서 90번째 백분위수, SAT 읽기 테스트에서 93번째 백분위수, SAT 수학 테스트에서 89번째 백분위수를 기록했습니다.
GPT-4는 자연어 이해 및 생성이 필요한 광범위한 애플리케이션에 사용될 수 있는 잠재력을 가지고 있습니다. 언어 학습 소프트웨어 듀오링고(Duolingo), 결제 제공업체 스트라이프(Stripe), 온라인 학습 플랫폼 칸아카데미(Khan Academy), 금융 서비스 회사 모건 스탠리(Morgan Stanley) 등이 현재 새 모델을 사용하고 있는 OpenAI의 성명서에 언급된 회사들 중 하나입니다.
Microsoft는 또한 자사의 챗봇인 BingAI가 모델이 공개되기 전부터 GPT-4를 계속 사용해 왔다고 보고했습니다.
“새로운 Bing이 검색용으로 사용자 정의한 GPT-4에서 실행되고 있음을 확인하게 되어 기쁘게 생각합니다. 지난 5주 동안 언제든지 새로운 Bing 미리 보기를 사용해 본 적이 있다면 이미 초기 경험을 했을 것입니다. 이 강력한 모델의 버전입니다.”
Microsoft의 기업 부사장이자 소비자 부문 최고 마케팅 책임자인 Yusuf Mehdi는 성명을 통해 이렇게 말했습니다.
OpenAI에 따르면 GPT-4는 "고급 추론, 복잡한 지침 이해 및 더 많은 창의성이 필요한 작업에 탁월합니다".
사용자들은 출시 이후 짧은 시간 동안 다양한 창의적인 방식으로 GPT-4를 사용했다고 보고했습니다.
이 새로운 도구의 가능성은 무한하다고 믿어집니다.
기본적으로 ChatGPT에 접속하려면 먼저 OpenAI에 등록해야 합니다.
Microsoft가 새로운 Bing이 새로운 GPT 모델에서 실행된다는 것을 확인했기 때문에 수백만 명의 Bing 사용자가 이미 챗봇을 통해 Bing에 액세스할 수 있다는 것은 분명합니다.
새로운 모델은 API를 통해서도 액세스할 수 있으며, 회사는 모든 사람을 위해 모델을 향상시킬 수 있는 방법을 배우기 위해 GPT-4의 느린 출시 기간 동안 OpenAI Evals에 뛰어난 모델 평가를 제공하는 개발자를 위한 API 액세스에 우선순위를 두고 있다고 밝혔습니다.