GPT-4 é um curinga no jogo de cartas corporativo. Pode aumentar substancialmente a produtividade e levar a um trabalho de maior ou menor qualidade, dependendo da tarefa em questão e de como é utilizado. Em termos gerais, podemos adotar uma postura otimista ou pessimista quanto à rápida implementação do GPT-4 em ambientes de escritório em todo o mundo.
A posição optimista é que a assistência da IA conduzirá a um aumento da qualidade e da produtividade dos trabalhadores. Mais trabalho será feito mais rápido e melhor. A assistência da IA ajudará nas tarefas rotineiras, fornecerá suporte vital em tarefas não rotineiras e liberará tempo e recursos para que os funcionários se concentrem em coisas críticas para os negócios que “mexem a agulha”.
A posição pessimista é que a dádiva da assistência da IA é um cavalo de Tróia. A automação infiltrar-se-á nas empresas e consumirá lentamente o trabalho do conhecimento humano, pedaço por pedaço, em benefício de uma elite tecnológica super-rica e à custa dos assalariados desempoderados. Funcionários de escritório amantes do ChatGPT sofrem de uma espécie de síndrome de Estocolmo, flertando com seus próprios substitutos.
Minha opinião pessoal está mais inclinada para a postura pessimista. Reconheço como o GPT-4 é útil como ferramenta de recuperação de informações, essencialmente uma versão mais inteligente e personalizada da Pesquisa Google. Mas se eu dependesse da ajuda de um chatbot para, digamos, escrever um rascunho para um artigo ou debater novas ideias para uma postagem, por que fazer o trabalho em primeiro lugar? Você também pode terceirizá-lo completamente para a IA ou, de preferência, nem fazer o trabalho.
Hoje, daremos uma olhada em um artigo da Harvard Business School que esclarece o impacto da assistência GPT-4 no trabalho do conhecimento: “ Navegando na Fronteira Tecnológica Jagged: Evidência Experimental de Campo dos Efeitos da IA na Produtividade e Qualidade do Trabalhador do Conhecimento ” , publicado em setembro de 2023.
Um grupo de cientistas sociais realizou uma experiência para testar as competências de 758 consultores do Boston Consulting Group (BCG) em diferentes tarefas com e sem acesso ao GPT-4.
Aproximadamente metade dos consultores participantes (385) realizou 18 tarefas relacionadas ao desenvolvimento de produtos criativos, enquanto a outra metade (373) se envolveu em uma tarefa de resolução de problemas de negócios que dependia de dados externos e outras fontes. Examinaremos mais de perto as tarefas específicas na próxima seção.
Todos os participantes fizeram um teste inicial sem assistência de IA para que os pesquisadores pudessem avaliar o desempenho individual do consultor sem ajuda em relação ao seu desempenho com o GPT-4. Os participantes também foram designados para um dos três subgrupos dentro dos dois experimentos: um grupo de controle sem acesso ao GPT-4, um segundo grupo com acesso ao GPT-4 e um terceiro grupo com acesso ao GPT-4 e material didático. sobre como solicitar o GPT-4 de forma eficaz.
Os resultados do desenho do título mostraram que os consultores com acesso à IA em geral tiveram um desempenho notavelmente melhor nas tarefas criativas de desenvolvimento de produtos. Aqui, o consultor concluiu em média 12,2% mais tarefas, concluiu as tarefas 25,1% mais rapidamente e com qualidade 40% superior, de acordo com avaliadores humanos que avaliaram cegamente os testes.
O segundo grupo de consultores que trabalhou com tarefas de resolução de problemas de negócios teve 19% menos probabilidade de produzir resultados corretos com acesso ao GPT-4. Em média, o GPT-4 ajudou os consultores a concluir as tarefas alguns minutos mais rápido: seis minutos mais rápido para “GPT apenas” e onze minutos para “GPT + Visão geral”.
Com base nos resultados experimentais, a equipe de pesquisa imagina uma “fronteira irregular”.
Dentro da “fronteira irregular”, a assistência da IA aumenta a qualidade e a produtividade do desempenho humano. Fora da fronteira, a assistência da IA restringe-a. A fronteira é “irregular” porque é difícil prever quais tarefas estão dentro ou fora da fronteira e às vezes parece ilógica. Por exemplo, o GPT-4 pode ser aprovado na maioria dos exames universitários , mas também tem dificuldades com problemas básicos de matemática .
O conceito de “fronteira irregular” é adequado. No entanto, na minha opinião, o artigo exagera significativamente as capacidades do GPT-4. Mais importante ainda, isso se deve às rígidas restrições de tempo sob as quais os consultores do BCG tiveram que trabalhar no experimento.
Na parte do experimento de desenvolvimento de produtos criativos - onde foi demonstrado que a assistência do GPT-4 aumenta significativamente a produtividade e a qualidade - os consultores tiveram que concluir 18 tarefas em apenas 90 minutos. Aqui estão alguns exemplos de tarefas que os consultores tiveram que responder dentro do limite de 90 minutos:
“Gerar ideias para um novo calçado voltado para um mercado ou esporte específico que não é atendido. Seja criativo e dê pelo menos 10 ideias.”
“Crie uma lista de etapas necessárias para lançar o produto. Seja conciso, mas abrangente.
“Crie um nome para o produto: considere pelo menos quatro nomes, anote-os e explique aquele que você escolheu.”
“Escreva um memorando de 500 palavras para seu chefe explicando suas descobertas.”
“Escreva um texto de marketing para um comunicado à imprensa.”
“Por favor, sintetize os insights que você obteve nas perguntas anteriores e crie um esboço para um artigo no estilo Harvard Business Review de aproximadamente 2.500 palavras.”
Apenas uma dessas tarefas individualmente poderia levar dias, até semanas para ser concluída. Nem mesmo o consultor de elite do mundo poderia realizar todas essas tarefas com um nível satisfatório de qualidade e precisão em 90 minutos. É humanamente impossível.
No experimento com tarefas “fora da fronteira”, os participantes tiveram que analisar o desempenho da marca de uma empresa hipotética com base em insights de entrevistas e dados financeiros e preparar uma nota de 500 a 750 palavras para um CEO fictício. A restrição de tempo nesta parte do experimento foi de 60 minutos, o que, novamente, não se aproxima em muito do tempo que os consultores realmente gastariam em uma tarefa como essa na vida real.
Minha hipótese : quanto mais tempo você dá aos humanos para realizar uma tarefa, menos significativa é a assistência da IA. Se, por exemplo, os consultores do BCG tivessem semanas ou meses para realizar as mesmas 18 tarefas criativas de desenvolvimento de produtos - o que refletiria melhor como os consultores realmente trabalham - as melhorias decorrentes do uso do GPT-4 seriam, na melhor das hipóteses, minúsculas. No geral, o resultado final também seria de qualidade significativamente superior ao que um ser humano pode produzir com GPT-4 em 90 minutos.
Na minha opinião, navegar pela fronteira irregular não se trata de entender que tipo de tarefas o GPT-4 pode efetivamente ajudá-lo, mas sim de explorar quais habilidades você pode oferecer e que a automação não pode substituir facilmente.
Os autores analisaram diferentes abordagens que os participantes adotaram para trabalhar com IA e identificaram dois modelos predominantes, “comportamento centauro” e “comportamento ciborgue”:
“Compreender as características e comportamentos destes participantes pode ser importante à medida que as organizações pensam em formas de identificar e desenvolver talentos para uma colaboração eficaz com ferramentas de IA .
Identificamos dois modelos predominantes que encapsulam sua abordagem.
O primeiro é o comportamento do Centauro. Nomeada em homenagem à criatura mítica que é metade humana e metade cavalo, esta abordagem envolve uma divisão estratégica de trabalho semelhante entre humanos e máquinas intimamente fundidos. Os usuários com esta estratégia alternam entre IA e tarefas humanas, alocando responsabilidades com base nos pontos fortes e capacidades de cada entidade. Eles discernem quais tarefas são mais adequadas para intervenção humana e quais podem ser gerenciadas de forma eficiente pela IA.
O segundo modelo que observamos é o comportamento Cyborg. Nomeada em homenagem a seres híbridos homem-máquina, conforme previsto na literatura de ficção científica, esta abordagem trata de uma integração intrincada. Os usuários Cyborg não apenas delegam tarefas; eles entrelaçam seus esforços com a IA na fronteira das capacidades. Esta estratégia pode manifestar-se como responsabilidades alternadas ao nível da subtarefa, como iniciar uma frase para a IA completar ou trabalhar em conjunto com a IA.”
Não sou um grande fã de enquadrar o GPT-4 como um parceiro de colaboração. Principalmente por dois motivos:
Nas parcerias humano-IA, a IA pode fazer a maior parte do trabalho, mas a responsabilidade total pelo trabalho cabe ao ser humano.
Prefiro gastar meu tempo criando um novo trabalho do zero do que revisando e editando resultados gerados por IA em busca de erros, imprecisões e preconceitos. Em primeiro lugar, revisar o conteúdo gerado automaticamente não é muito divertido. Em segundo lugar, não importa o que aconteça, continuo responsável por quaisquer erros que possam ocorrer. Se eu dependesse demais do GPT-4 para concluir uma tarefa, não conseguiria explicar por que cometi os erros que cometi e também não poderei aprender ou crescer com eles. Até que ponto podemos dizer que uma obra ainda é o resultado de um esforço criativo exclusivamente humano quando o trabalhador está “colaborando” com a IA generativa?
“O julgamento profissional de um advogado não pode ser delegado à IA generativa e continua sendo sempre responsabilidade do advogado.”
- “Orientação Prática para o Uso de Inteligência Artificial Gerativa na Prática do Direito ”, Comitê Permanente de Responsabilidade e Conduta Profissional da Ordem dos Advogados do Estado da Califórnia (novembro de 2023).
Como escrevi em meu último post , houve uma breve janela de tempo após a vitória do Deep Blue em 1997 sobre o atual campeão de xadrez Garry Kasparov, onde parecia que os humanos colaborando com a IA poderiam derrotar até mesmo os motores de xadrez mais fortes. Kasparov popularizou o termo “centauros” para descrever essas equipes mistas de humanos e IA.
No entanto, tal como está hoje, os humanos não podem contribuir com muita experiência em jogos disputados entre os principais programas de xadrez. Na verdade, tudo o que os humanos podem contribuir é para um aumento da taxa de erro. Acontece que jogar xadrez é algo que as IAs fazem muito melhor do que os humanos.
Acredito que podemos tirar uma lição importante da evolução da IA no tabuleiro de xadrez: “centauros” e “ciborgues” são eventualmente derrotados por mais automação. Por analogia, os trabalhadores de escritório que dependem fortemente da assistência da IA devem começar a pensar profundamente sobre as competências únicas que podem oferecer e que um modelo de IA não pode. Provavelmente, a principal função dos centauros e ciborgues é alimentar seus substitutos com mais material de treinamento, especialmente para tarefas que podem ser facilmente automatizadas e não envolvem muita interação social, adaptação, flexibilidade e comunicação.
Como podem ser derrotados centauros e ciborgues no local de trabalho moderno? Simplesmente, você os derrota com mais tempo. Se os humanos tiverem mais tempo para realizar trabalhos complicados e criativos, a ajuda do GPT-4 será supérflua.
Por outro lado, certas tarefas que os humanos realizam hoje “em colaboração” com a IA generativa serão totalmente automatizadas num futuro próximo. Suponha que um trabalhador humano não consiga produzir um resultado substancialmente melhor durante um longo período de tempo do que as futuras gerações de GPT-4 podem produzir em poucos segundos. Nesse caso, não há realmente razão para continuar a terceirizar esse tipo de tarefas para trabalhadores humanos.
Na minha interpretação, navegar pela fronteira irregular significa realmente perguntar: que habilidade única posso oferecer que não possa ser substituída pela automação em alguns anos?
Inscreva-se no meu boletim informativo gratuito The Gap: www.futuristiclawyer.com
Também publicado aqui .