GPT-4는 기업 카드 게임의 조커입니다. 생산성을 크게 높일 수 있으며 현재 작업과 사용 방법에 따라 작업 품질이 높아지거나 낮아질 수 있습니다. 광범위하게 말하면, 우리는 전 세계 사무실 환경에 대한 GPT-4의 신속한 구현에 대해 낙관적이거나 비관적인 입장을 취할 수 있습니다.
낙관적인 입장은 AI 지원이 근로자의 품질과 생산성 향상으로 이어질 것이라는 것입니다. 더 많은 작업이 더 빠르고 더 잘 수행될 것입니다. AI 지원은 일상적인 작업에 도움이 되고, 비일상적인 작업에 중요한 지원을 제공하며, 작업자가 "바늘을 움직이는" 비즈니스에 중요한 작업에 집중할 수 있는 시간과 리소스를 확보합니다.
비관적인 입장 은 AI 지원이라는 선물이 트로이 목마라는 것이다. 자동화는 기업에 침투하여 매우 부유한 기술 엘리트의 이익을 위해, 그리고 힘이 없는 임금 근로자를 희생시키면서 천천히 인간의 지식을 하나씩 먹어치울 것입니다. ChatGPT를 좋아하는 사무실 직원들은 일종의 스톡홀름 증후군을 앓고 있으며 자신의 대체자를 유혹합니다.
내 개인적인 의견은 비관적 입장에 더 가깝다. 저는 GPT-4가 정보 검색 도구, 즉 본질적으로 Google 검색의 더 스마트하고 개인화된 버전으로 얼마나 유용한지 알고 있습니다. 하지만 기사 초안을 작성하거나 게시물에 대한 새로운 아이디어를 브레인스토밍하는 등의 작업이 챗봇의 도움에 의존한다면 애초에 왜 작업을 수행해야 할까요? AI에 완전히 아웃소싱하거나 작업을 전혀 수행하지 않는 것이 좋습니다.
오늘 우리는 지식 작업에 대한 GPT-4 지원의 영향을 조명하는 Harvard Business School 논문을 살펴보겠습니다. " 들쭉날쭉한 기술 개척지 탐색: AI가 지식 근로자 생산성 및 품질에 미치는 영향에 대한 현장 실험적 증거 " , 2023년 9월에 출판됨.
사회과학자 그룹은 보스턴 컨설팅 그룹(BCG) 소속 컨설턴트 758명의 GPT-4 액세스 유무에 관계없이 다양한 작업에 대한 기술을 테스트하는 실험을 수행했습니다.
참여 컨설턴트 중 약 절반(385명)이 창의적 제품 개발과 관련된 18가지 작업을 수행했고, 나머지 절반(373명)은 외부 데이터 및 기타 소스에 의존하는 비즈니스 문제 해결 작업에 참여했습니다. 다음 섹션에서 구체적인 작업을 자세히 살펴보겠습니다.
모든 참가자는 AI 지원 없이 초기 테스트를 수행하여 연구원은 GPT-4를 사용한 성과와 개별 컨설턴트의 비보조 성과를 벤치마킹할 수 있었습니다. 또한 참가자들은 두 실험 내에서 세 가지 하위 그룹 중 하나에 배정되었습니다. 하나는 GPT-4에 액세스할 수 없는 통제 그룹, GPT-4에 액세스할 수 있는 두 번째 그룹, GPT-4 및 학습 자료에 액세스할 수 있는 세 번째 그룹입니다. GPT-4를 효과적으로 유도하는 방법에 대해 알아보세요.
헤드라인 그리기 결과, 전반적으로 AI에 접근할 수 있는 컨설턴트가 창의적인 제품 개발 작업에서 눈에 띄게 더 나은 성과를 내는 것으로 나타났습니다. 맹목적으로 테스트를 채점한 인간 평가자들에 따르면 컨설턴트는 평균 12.2% 더 많은 작업을 완료하고, 25.1% 더 빨리 작업을 완료했으며, 40% 더 높은 품질로 작업을 완료했습니다.
비즈니스 문제 해결 작업을 수행한 두 번째 컨설턴트 그룹은 GPT-4에 액세스하여 올바른 결과를 생성할 가능성이 19% 낮았습니다. 평균적으로 GPT-4는 컨설턴트가 작업을 몇 분 더 빨리 완료하는 데 도움이 되었습니다. "GPT만"의 경우 6분, "GPT + 개요"의 경우 11분 더 빨랐습니다.
연구팀은 실험 결과를 바탕으로 '들쭉날쭉한 프론티어'를 상상한다.
들쭉날쭉한 국경 내에서 AI 지원은 인간 성과의 품질과 생산성을 향상시킵니다. 국경 밖에서는 AI 지원이 이를 제한합니다. 경계는 "들쭉날쭉"합니다. 어떤 작업이 경계 내부 또는 외부에 속하는지 예측하기 어렵고 때로는 비논리적으로 보이기 때문입니다. 예를 들어, GPT-4는 대부분의 대학 시험에서 좋은 성적을 거둘 수 있지만 기본적인 수학 문제에도 어려움을 겪습니다 .
'들쭉날쭉한 국경'이라는 개념이 적절합니다. 그러나 내 생각에는 이 문서가 GPT-4의 기능을 훨씬 더 많이 판매하고 있는 것 같습니다. 가장 중요한 것은 BCG 컨설턴트가 실험에서 작업해야 했던 엄격한 시간 제한 때문이었습니다.
GPT-4 지원이 생산성과 품질을 크게 향상시키는 것으로 나타난 실험의 창의적인 제품 개발 부분에서 컨설턴트는 단 90분 만에 18가지 작업을 완료해야 했습니다. 다음은 컨설턴트가 90분 이내에 답변해야 하는 작업의 몇 가지 예입니다.
“특정 시장이나 서비스가 부족한 스포츠를 겨냥한 새로운 신발에 대한 아이디어를 창출하세요. 창의력을 발휘하고 최소한 10개의 아이디어를 제공하세요.”
“제품 출시에 필요한 단계 목록을 생각해 보세요. 간결하되 포괄적이어야 합니다.”
"제품 이름을 정하세요. 최소 4개 이상의 이름을 고려하고 적어본 후 선택한 이름을 설명하세요."
“당신이 발견한 것을 설명하는 500단어 메모를 상사에게 써보세요.”
“보도자료를 위한 마케팅 카피를 작성하세요.”
"이전 질문에서 얻은 통찰력을 종합하여 약 2,500단어로 구성된 Harvard Business Review 스타일 기사의 개요를 작성해 주십시오."
이러한 작업 중 하나만 개별적으로 완료하는 데 며칠, 심지어 몇 주가 걸릴 수도 있습니다. 세계 최고의 엘리트 컨설턴트라도 90분 안에 만족스러운 수준의 품질과 정확성으로 이러한 모든 작업을 수행할 수는 없습니다. 인간적으로는 불가능합니다.
"경계 밖" 작업에 대한 실험에서 참가자들은 인터뷰 및 재무 데이터에서 얻은 통찰력을 기반으로 가상 회사의 브랜드 성과를 분석하고 가상의 CEO에게 보낼 500-750 단어 메모를 준비해야 했습니다. 실험의 이 부분에서 제한 시간은 60분이었습니다. 이는 컨설턴트가 실제 생활에서 이와 같은 작업에 실제로 소비하는 시간에 크게 근접하지 않습니다.
내 가설 : 인간에게 작업을 수행하는 데 더 많은 시간을 줄수록 AI 지원의 중요성은 줄어듭니다. 예를 들어, BCG 컨설턴트에게 동일한 18가지 창의적인 제품 개발 작업을 수행하도록 몇 주 또는 몇 달이 주어진다면(컨설턴트의 실제 작업 방식을 더 잘 반영할 수 있음) GPT-4 사용으로 인한 개선 사항은 기껏해야 미미할 것입니다. 전반적으로 최종 결과물의 품질은 인간이 GPT-4를 사용하여 90분 만에 생산할 수 있는 것보다 훨씬 더 높습니다.
내 생각에 들쭉날쭉한 경계를 탐색하는 것은 GPT-4가 어떤 종류의 작업에 효과적으로 도움이 될 수 있는지 이해하는 것이 아니라 자동화가 쉽게 대체할 수 없는 기술을 제공할 수 있는지 탐색하는 것입니다.
저자는 참가자들이 AI 작업에 취한 다양한 접근 방식을 분석하고 "켄타우로스 행동"과 "사이보그 행동"이라는 두 가지 주요 모델을 식별했습니다.
“조직이 AI 도구를 사용한 효과적인 협업을 위한 인재를 식별하고 개발하는 방법을 고려할 때 이러한 참가자의 특성과 행동을 이해하는 것이 중요할 수 있습니다.
우리는 그들의 접근 방식을 요약하는 두 가지 주요 모델을 확인했습니다.
첫 번째는 켄타우로스의 행동입니다. 반은 인간이고 반은 말인 신화 속 생물의 이름을 딴 이 접근 방식에는 인간과 기계가 밀접하게 융합된 유사한 전략적 노동 분업이 포함됩니다. 이 전략을 사용하는 사용자는 AI와 인간 작업 간에 전환하여 각 엔터티의 강점과 능력에 따라 책임을 할당합니다. 그들은 인간의 개입에 가장 적합한 작업과 AI가 효율적으로 관리할 수 있는 작업을 식별합니다.
우리가 관찰한 두 번째 모델은 사이보그 행동입니다. SF 문학에서 구상된 하이브리드 인간-기계 존재의 이름을 딴 이 접근 방식은 복잡한 통합에 관한 것입니다. 사이보그 사용자는 단순히 작업을 위임하는 것이 아닙니다. 그들은 능력의 최전선에서 AI와 그들의 노력을 엮습니다. 이 전략은 AI가 완료할 문장을 시작하거나 AI와 협력하여 작업하는 등 하위 작업 수준에서 교대 책임으로 나타날 수 있습니다.”
나는 GPT-4를 협업 파트너로 구성하는 것을 좋아하지 않습니다. 주로 두 가지 이유가 있습니다:
인간-AI 파트너십에서는 AI가 대부분의 작업을 수행하지만 작업에 대한 전적인 책임은 인간에게 있습니다.
나는 오류, 부정확성 및 편견이 있는지 AI가 생성한 출력을 검토하고 편집하는 것보다 처음부터 새로운 작업을 만드는 데 시간을 보내는 것이 훨씬 낫습니다. 우선, 자동으로 생성된 콘텐츠를 리뷰하는 것은 별로 재미가 없습니다. 둘째, 어떤 실수가 있더라도 나는 책임을 집니다. 작업을 완료하기 위해 GPT-4의 입력에 너무 많이 의존하면 내가 실수한 이유를 설명할 수 없으며 실수로부터 실제로 배우거나 성장할 수도 없습니다. 작업자가 생성 AI와 '협력'하는 경우, 작품은 어느 정도까지 인간 고유의 창의적 노력의 결과라고 말할 수 있습니까?
“변호사의 전문적 판단은 생성 AI에 위임될 수 없으며 항상 변호사의 책임입니다.”
- "법률 실무에서 생성 인공 지능의 사용을 위한 실무 지침 ", 전문적 책임 및 행동에 관한 캘리포니아 주 변호사 협회(2023년 11월).
내가 최신 게시물에서 썼듯이 , Deep Blue가 1997년 체스 챔피언 Garry Kasparov를 상대로 승리를 거둔 후 짧은 시간이 있었습니다. 인간이 AI와 협력하면 가장 강력한 체스 엔진도 이길 수 있는 것처럼 보였습니다. Kasparov는 이러한 혼합된 인간-AI 팀을 설명하기 위해 "켄타우로스"라는 용어를 대중화했습니다.
그러나 오늘날의 인간은 주요 체스 프로그램 간의 게임에서 많은 전문 지식을 갖고 기여할 수 없습니다. 실제로 모든 인간이 기여할 수 있는 것은 오류율 증가입니다. 체스를 두는 것은 AI가 인간보다 훨씬 더 잘하는 것으로 밝혀졌습니다.
나는 체스판에서 AI의 진화로부터 중요한 교훈을 얻을 수 있다고 믿습니다. "켄타우로스"와 "사이보그"는 결국 더 많은 자동화에 의해 패배합니다. 비유하자면, AI 지원에 크게 의존하는 직장인은 AI 모델은 제공할 수 없지만 자신이 제공할 수 있는 고유한 기술이 무엇인지 깊이 생각하기 시작해야 합니다. 켄타우로스와 사이보그의 주요 기능은 대체자에게 더 많은 교육 자료를 제공하는 것입니다. 특히 쉽게 자동화할 수 있고 사회적 상호 작용, 적응, 유연성 및 의사소통이 많이 필요하지 않은 작업의 경우 더욱 그렇습니다.
현대 직장에서 켄타우로스와 사이보그를 어떻게 물리칠 수 있을까요? 간단히 말해서, 더 많은 시간을 두고 그들을 물리치는 것입니다. 인간이 복잡하고 창의적인 작업을 수행하는 데 더 많은 시간을 허용한다면 GPT-4의 도움은 불필요합니다.
반면에, 오늘날 인간이 생성 AI와 "협력하여" 수행하는 특정 작업은 가까운 미래에 완전히 자동화될 것입니다. 인간 작업자가 미래 세대의 GPT-4가 몇 초 만에 내놓는 것보다 훨씬 더 나은 결과를 장기간에 걸쳐 생산할 수 없다고 가정해 보겠습니다. 그렇다면 그런 종류의 작업을 계속해서 인간 근로자에게 아웃소싱할 이유가 없습니다.
내 해석에 따르면 들쭉날쭉한 국경을 탐색하는 것은 실제로 다음과 같은 질문에 관한 것입니다. 몇 년 안에 자동화로 대체할 수 없는 고유한 기술이 무엇인지 제공할 수 있습니까?
무료 뉴스레터 The Gap에 가입하세요: www.futuristiclawyer.com
여기에도 게시되었습니다.