paint-brush
Explorando o impacto da IA generativa no futuro das notíciaspor@viggybala
737 leituras
737 leituras

Explorando o impacto da IA generativa no futuro das notícias

por Viggy Balagopalakrishnan12m2023/07/30
Read on Terminal Reader

Muito longo; Para ler

Gen AI pode melhorar a economia de notícias, mas o impacto no conteúdo de baixa complexidade (SEO hacking) versus o conteúdo de alta complexidade será muito diferente
featured image - Explorando o impacto da IA generativa no futuro das notícias
Viggy Balagopalakrishnan HackerNoon profile picture
0-item
1-item


Na semana passada, o New York Times informou que o Google está testando uma ferramenta de IA que permite que organizações de notícias criem conteúdo usando IA. Não está claro quais são os recursos exatos do produto, mas com base em um comentário do Google, ele ajuda em tarefas como manchetes e modificação de estilos de escrita. Em meio a temores sobre o impacto que isso poderia ter nos empregos dos jornalistas, o Google rapidamente divulgou uma declaração esclarecedora :


Nosso objetivo é dar aos jornalistas a opção de usar essas tecnologias emergentes de uma forma que melhore seu trabalho e produtividade. Simplesmente, essas ferramentas não pretendem e não podem substituir o papel essencial que os jornalistas têm em reportar, criar e verificar os fatos de seus artigos.


Isso gerou uma conversa acalorada sobre o futuro das notícias com IA generativa. As empresas que fabricam produtos de IA argumentam que essa tecnologia permitirá que organizações de mídia e jornalistas sejam mais eficazes, enquanto os críticos afirmam que isso pode prejudicar os empregos dos jornalistas, aumentar a desinformação e inundar o mercado com conteúdo gerado por IA de baixa qualidade.


Nesta peça, revelamos o impacto da IA generativa no futuro das notícias , explorando algumas coisas:


  • Tipos de artigos de notícias hoje por complexidade
  • O negócio das notícias
  • A anatomia da produção de uma reportagem
  • O que a IA generativa pode e não pode fazer bem
  • IA generativa e o futuro das notícias — um conto de dois mundos


Tipos de artigos de notícias hoje por complexidade

Existem diversos tipos de conteúdo jornalístico na internet, cada um com diferentes níveis de complexidade em sua produção. A complexidade normalmente surge de fatores como pontualidade, quantidade de pesquisa necessária e a história que está sendo contada.


Os artigos de baixa complexidade incluem:


  • Notícias de fatos/dados (por exemplo, artigo listando taxas de hipoteca em São Francisco, artigo com números de uma chamada de lucros de uma empresa) — são relativamente diretos com opiniões ou perspectivas subjetivas mínimas.


  • Notícias baseadas em interesses/informativas (por exemplo, receitas de verão publicadas no NY Times Cooking, um artigo explicando o que significa a taxa de juros do Fed) — há alguma criatividade na seleção de tópicos, mas o foco é mais informativo e voltado para interesses específicos.


  • Notícias de última hora (por exemplo, um artigo sobre a renúncia de um CEO, um artigo que descreve um evento climático ativo) — geralmente são artigos curtos sobre um evento que se desenrola rapidamente, com informações iniciais limitadas e fatos emergentes.


Os artigos de alta complexidade incluem:

  • Cobertura de notícias (com contexto, pesquisa e fatos) — fornecem uma explicação mais detalhada das notícias apoiadas por pesquisa, contexto adicional e, muitas vezes, entrevistas com pessoas, exigindo mais tempo e esforço para produzir; eles também são amplamente verificados.


  • Notícias interpretativas — inclui artigos de opinião, artigos de opinião e análises (como esta) que fornecem interpretações/perspectivas/opiniões sobre questões atuais; eles são muitas vezes subjetivos e requerem extensa pesquisa para apoiar as perspectivas.


  • Artigos de destaque - geralmente são mergulhos profundos em tópicos que podem não ser realmente notícias quentes no momento, mas questões importantes, o jornalismo investigativo se enquadraria nessa categoria; isso requer uma extensa pesquisa e entrevistas ao longo de meses, e também uma narrativa criativa.


Trago essa categorização porque o propósito por trás e o processo envolvido na produção desses dois tipos de artigos são muito diferentes e, consequentemente, evoluirão de maneira diferente com o uso da IA generativa. Com isso em mente, vamos falar sobre como as notícias geram dinheiro.


O negócio das notícias

O negócio de notícias é complicado - a maioria das organizações de notícias opera em um modelo de mídia suportado por anúncios, e um pequeno subconjunto conseguiu migrar para assinaturas. Isso tem grandes implicações para o tipo de conteúdo que uma organização de notícias produz.


Os negócios de notícias baseados em assinaturas (o NYTimes agora obtém aproximadamente 70% da receita de assinaturas) têm uma estratégia de conteúdo diretamente ligada ao valor do consumidor - foco em conteúdo de alta qualidade + conteúdo diversificado com base em interesses para fazer a assinatura valer a pena. Por exemplo, dos tipos de conteúdo acima, o NYT faz principalmente cobertura de notícias (que é bem pesquisada), notícias interpretativas e artigos de destaque para sua principal oferta de notícias, apoiada por conteúdo baseado em interesses como NYT Cooking e Wirecutter . Algumas outras publicações, como o Wall Street Journal e o Washington Post, avançaram com as assinaturas usando uma abordagem semelhante.


No entanto, a maioria das publicações ainda é suportada por anúncios e continuará a sê-lo no futuro previsível. Isso significa que eles estão focados em gerar alto engajamento: mais globos oculares → mais inventário de anúncios → mais receita. A estratégia que tem sido mais eficaz para eles é aumentar o conteúdo de alta complexidade (como cobertura de notícias, notícias interpretativas) com uma tonelada de conteúdo de alto volume e baixa complexidade (como notícias factuais/de dados, notícias baseadas em interesses/informativas).


Essa estratégia funciona porque o conteúdo de alta complexidade ajuda a agregar valor a longo prazo aos consumidores, enquanto a tonelada de conteúdo de baixa complexidade ajuda a chamar a atenção e a ganhar o jogo de SEO . O loop de SEO se parece com: alto volume de conteúdo que obtém cliques → mecanismos de pesquisa consideram seu conteúdo valioso → todo o seu conteúdo é classificado mais alto → mais olhos.


Isso não é uma crítica à estratégia e a necessidade de jogar o jogo de SEO é uma necessidade para a mídia suportada por anúncios. A realidade é que a mídia jornalística é um negócio terrível – a internet interrompeu a forma como o conteúdo foi criado e distribuído (principalmente por meio da Pesquisa do Google / Meta hoje), e as organizações de notícias não se recuperaram do impacto dessa interrupção. Há tentativas de corrigir o desequilíbrio, que ainda estão evoluindo — o Canadá/Austrália aprovou leis que obrigam o Google/Meta a pagar o que é essencialmente um “imposto disruptivo” para apoiar o bom jornalismo, algumas organizações como a NPR são parcialmente apoiadas por financiamento federal e outras jornais como o Washington Post são subsidiados por bilionários (geralmente bem-intencionados) .


Tudo isso para dizer - a mídia/jornalismo é um serviço público absolutamente essencial para o bom funcionamento da democracia, mas um negócio não tão bom. Portanto, quanto mais autossuficientes esses negócios de notícias puderem ser (sem depender de regulamentação ou bilionários), mais eficazes eles podem ser no cumprimento de sua missão. A IA generativa não pode resolver todos esses desafios estruturais (especialmente a distribuição de conteúdo), mas pode definitivamente tornar a criação de conteúdo mais eficiente sem necessariamente comprometer a qualidade.


A anatomia da produção de uma reportagem

Para entender em qual parte da produção de notícias a IA generativa terá mais impacto, é útil entender as diferentes etapas envolvidas na publicação de um artigo de notícias.


Podemos dividir o esforço em alguns componentes sequenciais:


  • Pesquisa — encontrar um tópico, reunir fatos/dados, conversar com as pessoas certas para citações ou perspectivas
  • Contar histórias — entender a pesquisa para criar um enredo convincente
  • Escrever — transformar o enredo em palavras reais que formam um artigo, abotoar o enredo, apoiá-lo com os dados corretos / adicionar links de suporte
  • Edição — melhorar a redação, criar títulos mais cativantes, ter recursos visuais melhores e verificar os fatos para atender aos padrões
  • Distribuição — publicação e distribuição em canais como mídias sociais.


Com base em algumas pesquisas e também influenciada pela minha experiência de escrita, estimo o esforço de produzir um artigo em algo como: Pesquisa (30%), Contação de Histórias (20%), Redação (20%), Edição (20%) e Distribuição (10%) . Pegue os números reais com um grão de sal, mas eles são direcionalmente precisos.


Agora, observe que nem todos os formatos de artigos de notícias exigem todas as etapas - as peças de baixa complexidade podem não precisar passar rigorosamente por todas as etapas do ciclo de vida acima, mas as peças de alta complexidade sim.


Por exemplo, este artigo levou cerca de 8 a 9 horas para terminar (o mesmo aconteceu com a maioria dos outros artigos no meu boletim Substack ), e eu gostaria de pensar que meus artigos se enquadram nas notícias interpretativas. Se eu escrevesse um artigo de baixa complexidade, provavelmente conseguiria fazê-lo em cerca de 2 horas. Outro ponto de dados - este repórter do NYT diz que normalmente consegue fazer um artigo de notícias em algumas horas, enquanto um artigo de destaque pode levar até 6 meses.


Então, em que a IA generativa pode realmente ajudar? Basicamente, tudo se resume a quais etapas do processo de produção de notícias os produtos atuais (e futuros) podem fazer bem.


O que a IA generativa pode e não pode fazer bem

Aqui está a minha opinião sobre cada passo. Spoiler - eles são um tanto eficazes para escrever e editar, podem ser eficazes para pesquisa se os produtos certos forem construídos e continuarão sendo ruins em contar histórias.

Pesquisa — capacidade surpreendentemente baixa

A maioria dos produtos atuais de IA generativa (como ChatGPT e Google Bard) têm capacidade surpreendentemente baixa quando se trata de pesquisa:


  • Definitivamente, existem certas capacidades nas quais eles são bons. Por exemplo, eles são bons em apresentar argumentos para um determinado ponto de vista ou fornecer inspiração para novos tópicos.


  • Eles são medianos a bons em resumir o conteúdo e, em particular, responder a perguntas com base na leitura de um artigo. Por exemplo, você pode pedir a eles que leiam este artigo e listem as diferentes etapas envolvidas na produção de notícias.


  • No entanto, eles geralmente produzem informações factualmente incorretas (“alucinações”), não fornecem links/fontes para o que afirmam ser a verdade e têm dados de origem questionável com possível violação de direitos autorais. Veja a imagem abaixo.



(esquerda-ChatGPT) Bom em criar um argumento vs (direita-Bard) ruim em fornecer informações ou fontes verificadas; Fonte: criado pelo autor



Para um caso de uso genérico (digamos que você queira redigir um e-mail para uma futura conexão do LinkedIn), esses problemas não importam. Mas quando você está escrevendo um artigo de notícias, não verificar os fatos pode prejudicar gravemente a percepção da sua marca.


Embora as ferramentas de pesquisa possam ser usadas para pesquisas direcionais úteis (por exemplo, você deseja saber quanta participação de mercado o Bing e a pesquisa do Yahoo têm), os escritores/jornalistas ainda precisam fazer um trabalho adicional para encontrar uma nova fonte para vincular, porque as ferramentas atuais não fornecer links nem ter dados totalmente precisos.


Usar dados de origem limpa + ser capaz de fornecer respostas com links confiáveis é uma grande oportunidade para qualquer um que esteja construindo um produto de pesquisa para escritores, e é muito provável que novas empresas surjam aqui.


Contação de histórias - baixa capacidade

Os recursos de narrativa da IA generativa são bastante fracos hoje. Aqui está um exemplo: fiz várias pesquisas para este artigo, reuni a pesquisa em um formato organizado e pedi ao ChatGPT para me fornecer um enredo. Veja a captura de tela abaixo para obter os resultados.


À primeira vista, parece que “fazem sentido”. Mas isso é literalmente tudo o que é - faz sentido superficialmente. Na realidade, nenhuma dessas histórias é muito atraente e as notas de pesquisa que forneci tinham muito mais detalhes e nuances além dos resultados superficiais fornecidos aqui. Você pode argumentar que ainda são decentes, mas no contexto de escrever um artigo, isso foi completamente inútil para mim - na melhor das hipóteses, isso foi inspiração/ideias, não um enredo baseado na pesquisa que enviei.



(esquerda) Notas de pesquisa alimentadas no ChatGPT, (direita) histórias geradas; Fonte: criado pelo autor



Se você tiver uma história de baixa complexidade, ela fará o trabalho para você. Se você está construindo uma história com nuances, ou tem os dados e precisa de ajuda para construir uma história, os produtos atuais não dão conta do recado. Dada a alta quantidade de subjetividade envolvida, não sou otimista, vai melhorar e essa continuará sendo a parte em que os escritores podem agregar mais valor.


Escrita - capacidade média

Se você fornecer produtos atuais com um enredo detalhado do que deseja dizer, isso pode gerar uma v1 mal decente do conteúdo. A saída ainda é bastante padronizada e é bastante desafiador instruir os modelos atuais para criar a linguagem de forma que ela conte uma história. Veja a captura de tela para obter um exemplo de saída depois de alimentar o ChatGPT com notas detalhadas sobre o enredo deste artigo.


À primeira vista, você pode pensar que parece bom para um rascunho v1. Não é - o tom não está certo, a história não flui e sempre parece que foi escrita por um bot. É muito genérico e não articula a história apesar de ser alimentado por uma narrativa muito específica. Se eu publicasse esse artigo, você não o leria. E esse é o desafio com a capacidade de redação hoje - pode funcionar para artigos de baixa complexidade, mas para algo mais complexo, você basicamente precisa reescrever todo o rascunho.



(esquerda) história detalhada fornecida ao ChatGPT, (direita) v1 rascunho do artigo; Fonte: criado pelo autor



O grande desbloqueio do produto aqui seria permitir a instrução humana eficaz - os escritores não querem usar versões padronizadas terríveis e refazer tudo linha por linha. O que eles gostariam é de alguma forma de construção de interação com o usuário que permita ao escritor alimentar um enredo e elaborar sequencialmente o artigo seção por seção, enquanto fornece feedback ativo à ferramenta de IA. A cereja no topo seria a capacidade de personalizar o estilo de escrita, alimentando artigos anteriores escritos pelo mesmo escritor.


Acho que os modelos subjacentes hoje têm a capacidade de fazer isso e há necessidade de inovação na camada de interface do usuário , o que acredito que acontecerá no curto prazo.


Edição — capacidade média

As ferramentas hoje têm uma boa quantidade de recursos para revisar artigos, encontrar erros e fazer correções. Essas ferramentas também são muito boas em tarefas cosméticas, como criar ideias para manchetes atraentes ou títulos de seções que possam ter um bom desempenho.


No entanto, ainda há trabalho necessário na camada de interface do usuário para torná-la utilizável para edição - existem algumas soluções parciais hoje, como o Notion AI , que permite melhorar a linguagem e tornar as frases mais curtas/longas em uma página do Notion, mas não captura o contexto completo da página. O ChatGPT faz um bom trabalho ao fazer edições em um artigo completo, mas não tem a capacidade de obter instruções para editar facilmente seções específicas e também não pode oferecer suporte a links (ou seja, dou uma sinopse com texto que possui hiperlinks, recebo de volta o texto sem nenhum link) .


Eu absolutamente odeio a parte de edição do processo de escrita, e tenho certeza de que vários escritores e jornalistas também - a IA generativa pode definitivamente minimizar parte desse trabalho pesado de edição a curto prazo.


Distribuição - capacidade média

Existem ferramentas chegando aqui hoje que, por exemplo, ajudam você a gerar snippets sociais ou identificar partes de sua história que podem se tornar mais virais. Isso provavelmente continuará melhorando no futuro.


IA generativa e o futuro das notícias — um conto de dois mundos

Com base na análise acima, você pode ver uma clara dualidade emergindo:

  1. Formatos de baixa complexidade , que exigem pesquisa e narrativa mais simples e podem ser escritos e editados facilmente, começarão a ser cada vez mais gerados por IA (ou fortemente assistidos por IA).


  2. Formatos de alta complexidade , que exigem recursos de pesquisa e narrativa mais complexos que não existem hoje, continuarão a ser criados principalmente por jornalistas, mas a IA generativa pode trazer uma boa quantidade de eficiência, minimizando o trabalho pesado de redação e edição.


Embora o conteúdo de baixa complexidade gerado por IA pareça ruim à primeira vista, esses artigos são escritos principalmente para fins de SEO ou para aumentar o conteúdo de alta qualidade existente, e a corrida para a comoditização começou muito antes da onda generativa de IA. Por exemplo, a Associated Press tem usado bots para publicar artigos relatando os ganhos da empresa desde 2014. A vantagem aqui - esse não é o tipo de conteúdo que os jornalistas desejam gastar tempo criando e automatizar isso liberará seu tempo para conteúdo de alta complexidade.


Cada vez mais conteúdo de alta complexidade surgirá. Os recursos de pesquisa e narrativa com produtos hoje são limitados, o que significa que a capacidade de construir uma história atraente com base em informações e contar histórias de uma maneira única continuará a ser a maior moeda que os jornalistas têm . Isso, acelerado por ferramentas de redação e edição de IA que eliminam o trabalho pesado de publicar conteúdo de qualidade, será um grande benefício para os jornalistas.


E quanto a algumas das preocupações levantadas sobre o uso de IA para notícias? Alguns são justos, mas acredito que sejam solucionáveis:


  • Uma onda de conteúdo lixo de SEO – o Google assumiu a posição de que não penalizará o conteúdo gerado por IA e recebeu críticas por abrir um mundo de conteúdo lixo, incluindo artigos factualmente incorretos. Essa é uma crítica um tanto justa, mas acredito que o Google irá reprimir isso - não pela bondade de seus corações, mas porque o cerne de um produto de pesquisa é fornecer resultados úteis aos usuários. O Google já tem penalidades para práticas de hacking de SEO (como preenchimento de palavras-chave e cultivo de links) e seria fácil estender essa estrutura para conteúdo de IA.


  • Jornalistas perderão empregos - Alguns levantaram a preocupação de que os jornalistas possam perder empregos ou estar em uma posição menos vantajosa (como os escritores de Hollywood que estão em greve); a grande diferença aqui é que, embora haja um grande número de escritores em Hollywood, o emprego nas redações nos EUA caiu 26% desde 2008, não porque não precisamos de jornalistas, mas porque notícias são um péssimo negócio; A IA generativa pode ajudar a consertar a economia do negócio enquanto continua capacitando os jornalistas a fazerem o que amam.


Conclusão

Não sou de forma alguma um maximalista da IA e acho absolutamente que existem riscos reais para a IA que precisam ser abordados à medida que escalamos a tecnologia. No entanto, acho importante analisar cada mercado/situação impactado pela IA separadamente e não agrupá-los em um grande problema de impacto da IA.


No caso das notícias, a IA generativa pode melhorar tremendamente a economia dos negócios de notícias. Os produtos não estão lá hoje - há uma clara necessidade de produtos de IA que solucionem cuidadosamente as necessidades dos escritores sem uma interface de modelo de linguagem de força bruta, baseada em bate-papo, mas estou confiante de que eles surgirão no curto prazo.


A escrita de baixa complexidade será cada vez mais gerada por IA e tudo bem - pode ajudar as empresas a operar uma máquina de SEO eficiente, enquanto os jornalistas (auxiliados por IA para trabalho pesado) trazem à vida muito mais conteúdo de alta complexidade que eleva o discurso público.



Obrigado por ler!


Publicado originalmente aqui.