paint-brush
O que a IA fará com a ciência de dadospor@docligot
763 leituras
763 leituras

O que a IA fará com a ciência de dados

por Dominic Ligot5m2024/10/27
Read on Terminal Reader
Read this story w/o Javascript

Muito longo; Para ler

Refletindo sobre a natureza altamente manual e contenciosa da ciência de dados e a mudança inevitável para a IA
featured image - O que a IA fará com a ciência de dados
Dominic Ligot HackerNoon profile picture
0-item

Recentemente, ministrei uma aula sobre o uso da ciência de dados para segurança cibernética, com foco na análise de dados de captura de pacotes — um tópico um tanto técnico e tradicionalmente seco. A abordagem que compartilhei foi extraída da minha experiência em segurança cibernética em instituições financeiras, abrangendo etapas principais como análise exploratória de dados, pré-processamento e transformação de dados de log e identificação de anomalias por meio de uma combinação de clustering e análise de rede de grafos.


Um aspecto surpreendente foi o tempo que gastei me preparando para esta sessão — uma fração do que eu normalmente investiria. A IA desempenhou um papel significativo na simplificação do processo. Usei Claude para ajudar com a codificação, desenvolvimento do esboço e até mesmo criação dos slides. No total, o curso inteiro ficou pronto em 48 horas.


A sessão acabou sendo envolvente. Os participantes, principalmente CISOs que normalmente não codificam, acharam os exercícios, elaborados com a assistência da IA, intuitivos e práticos. Meu objetivo era mergulhá-los no trabalho direto com dados e código. Eles apreciaram especialmente a chance de explorar manualmente o que a vigilância moderna de ameaças cibernéticas e as plataformas SIEM normalmente automatizam, obtendo insights sobre os processos que acontecem "por baixo dos panos".


Minha principal lição da aula foi surpreendentemente contraintuitiva: a ciência de dados, como a conhecemos, acabará sendo substituída pela IA . Essa visão pode parecer prematura — ou talvez à frente de seu tempo — mas é uma perspectiva que justifica discussão.


Aviso: algumas dessas coisas podem ser irritantes para algumas pessoas.

Sensualidade é bagagem

Por mais de uma década, a ciência de dados tem sido celebrada como o “trabalho mais sexy do século XXI”. No entanto, à medida que a IA avança rapidamente, está ficando claro que os desafios subjacentes do campo são mais difíceis de ignorar. O advento da poderosa IA generativa pode muito bem ser o ponto de inflexão para uma disciplina que, em retrospecto, pode ter sido mais vagamente definida e superestimada do que inicialmente reconhecido.


Em sua essência, a ciência de dados combina ciência da computação, estatística e perspicácia empresarial, oferecendo às organizações a promessa de insights acionáveis a partir de grandes quantidades de dados. Esse conjunto de habilidades é inegavelmente valioso no mundo atual, orientado por dados. No entanto, por trás de sua imagem polida, o campo enfrenta problemas significativos. O que é frequentemente rotulado como ciência de dados frequentemente acaba sendo uma colcha de retalhos de tarefas vagamente relacionadas que nem sempre se alinham perfeitamente, e muitos profissionais na área lutam com toda a amplitude e complexidade que a disciplina exige.


O surgimento de ferramentas orientadas por IA capazes de lidar com análise de dados, modelagem e geração de insights pode forçar uma mudança em como vemos o papel e o futuro da ciência de dados em si. À medida que a IA continua a simplificar e automatizar muitas das tarefas fundamentais dentro da ciência de dados, o campo pode enfrentar um acerto de contas sobre o que realmente significa ser um cientista de dados na era da automação inteligente.

As rachaduras

Muitos cientistas de dados, apesar de usarem habilidades sofisticadas de codificação e ferramentas digitais, se envolvem em um trabalho surpreendentemente manual e propenso a erros . A preparação, limpeza e análise de dados envolvem tarefas tediosas e demoradas, repetitivas e mecânicas. Na verdade, uma quantidade significativa de trabalho de ciência de dados é gasta na preparação de conjuntos de dados — uma tarefa que muitas vezes parece mais uma tarefa árdua do que a ciência empolgante e voltada para descobertas que é apresentada. Esse problema é agravado pelo fato de que muitos que entram no campo são, na melhor das hipóteses, amadores. Tendo feito alguns cursos online em Python ou R, esses "cientistas de dados" geralmente não estão preparados para os rigores da função . Ciência de dados não é apenas codificação. Envolve análise profunda, compreensão contextual e a capacidade de apresentar insights para públicos não técnicos. Na verdade, é mais um trabalho de pesquisa, exigindo uma mistura de criatividade e pensamento analítico que muitos no campo simplesmente não possuem.


Além disso, muitos cientistas de dados desenvolveram um senso de direito, esperando altos salários e pacotes lucrativos apenas em virtude de seu título. Essa atitude está afastando empresas, especialmente em setores onde a eficiência de custos é primordial. Conheci empresas que antes se apressavam em contratar cientistas de dados, mas agora estão reconsiderando. Por que pagar altos salários a alguém que passa a maior parte do tempo lutando com limpeza de dados, quando a IA pode fazer isso mais rápido, melhor e por uma fração do custo?

IA Quem?

Como eu pessoalmente experimentei escrevendo a aula, a IA Generativa evoluiu para uma força poderosa nas áreas em que a ciência de dados é mais fraca. Tarefas como preparação de dados, limpeza e até mesmo análise qualitativa básica — atividades que consomem muito do tempo de um cientista de dados — agora são facilmente automatizadas por sistemas de IA . O que é pior (ou melhor, dependendo de onde você está) é que a IA é mais rápida, mais precisa e menos propensa a erro humano ou fadiga.


Para muitos cientistas de dados, isso pode ser assustador. Afinal, essas tarefas representam a maior parte do seu trabalho diário. A limpeza de dados, por exemplo, é notoriamente demorada e propensa a erros, mas a IA agora pode realizá-la com alguns cliques e precisão quase perfeita. Os cientistas de dados costumam reclamar dessas tarefas pesadas, mas elas são fundamentais para suas funções. À medida que os sistemas de IA melhoram, a necessidade de humanos para fazer esses trabalhos diminui. Não é surpresa que muitas das críticas vocais contra a IA venham dos próprios cientistas de dados . Eles veem a escrita na parede e temem por seus empregos.

A mesquinharia

Para piorar a situação dos cientistas de dados, o campo não fez progressos significativos nos últimos anos. Apesar de sua ascensão meteórica em popularidade, a ciência de dados ainda é atormentada por ineficiências, erros e falta de clareza sobre o que exatamente ela deveria implicar . Antigamente, acreditava-se que ferramentas mais sofisticadas e melhor treinamento evoluiriam o campo, mas isso não se materializou na extensão esperada. Em contraste, a IA tem melhorado constantemente. Algoritmos de aprendizado de máquina, processamento de linguagem natural e modelos generativos estão evoluindo rapidamente, deixando a ciência de dados tradicional para trás.


Novamente, as altas expectativas salariais dos cientistas de dados agravam o problema . Empresas que antes toleravam ineficiências agora estão percebendo que a IA pode substituir muito do trabalho braçal sem o alto preço associado ao trabalho humano. Com a IA se tornando mais adepta à execução de tarefas-chave como análise, previsão e até mesmo apresentação, a natureza manual da ciência de dados está se tornando cada vez mais redundante. Muitas empresas perceberão que o que costumava exigir uma equipe de cientistas de dados agora pode ser tratado de forma mais eficiente por ferramentas alimentadas por IA.

A mudança

A realidade é que a ciência de dados, como tradicionalmente definida, está à beira da obsolescência. Com a IA generativa avançando a uma taxa surpreendente, a demanda por cientistas de dados humanos em sua forma atual provavelmente diminuirá . Isso não implica que os humanos não tenham papel na tomada de decisões orientada por dados, mas o papel clássico de “cientista de dados” pode em breve ser um conceito do passado. O que é necessário agora são profissionais qualificados em colaborar com IA, aproveitando suas capacidades enquanto se concentram no pensamento estratégico e na resolução de problemas complexos em um nível mais alto.


A IA não é o fim da análise, dos insights ou da tomada de decisões — ela representa sua evolução . O campo atual da ciência de dados corre o risco de se tornar obsoleto se não evoluir no mesmo ritmo. A IA já está revolucionando indústrias, e a ciência de dados deve se adaptar ou corre o risco de ser ultrapassada por essa onda. No final das contas, a questão pode não ser se a IA eliminará a ciência de dados, mas se a ciência de dados algum dia cumprirá totalmente suas promessas.


Ou talvez a distinção nem importe se finalmente superarmos o exagero da “ciência de dados” e adotarmos a IA como a próxima progressão lógica.



Sobre mim: Veterano de TI com mais de 25 anos, combinando dados, IA, gerenciamento de risco, estratégia e educação. Vencedor de 4 hackathons e impacto social de defensor de dados. Atualmente trabalhando para impulsionar a força de trabalho de IA nas Filipinas. Saiba mais sobre mim aqui: https://docligot.com