Você não pode realmente investir em uma equipe de dados muito cedo. Isso é algo que aprendemos como uma equipe pequena, mas crescente. Investimos em uma equipe de dados em um estágio inicial, para que pudéssemos estabelecer tendências de uso do produto, criar insights de negócios e identificar áreas para melhorar nosso produto.
Se você é uma startup em estágio inicial, comece a construir sua equipe e arquitetura de estratégia de dados assim que puder. Você não precisa crescer muito — uma equipe de dados de uma pessoa só pode fazer uma enorme diferença para o seu sucesso à medida que você cresce.
Quando se trata de lançar sua equipe de dados, você pode ficar tentado a contratar um especialista da maior marca possível. Nosso conselho: encontre alguém com experiência em startup em estágio inicial e que também tenha trabalhado com dados em escala.
Existem pessoas maravilhosas com mentes brilhantes trabalhando em grandes equipes de dados empresariais, mas essas grandes equipes geralmente têm seus funcionários especializados em partes específicas de sua plataforma de dados. Isso faz sentido quando você tem 10 engenheiros de dados em uma equipe ou quando você tem uma grande equipe de cientistas de dados de aprendizado de máquina trabalhando em algoritmos de precificação. Mas quando você tem apenas uma função de dados para toda a organização, precisa de alguém que possa fazer um pouco de tudo.
É importante primeiro contratar alguém versátil que possa criar insights de dados, desenvolver hipóteses de negócios e criar uma arquitetura de dados escalável do zero. Você precisa de alguém pronto para começar a construir a equipe de dados desde o início, de preferência alguém que possa contratar o restante de sua equipe assim que estiver pronto para isso.
Essa primeira contratação deve ser alguém que tenha experiência em construir (ou pelo menos trabalhar) uma equipe de dados em uma startup em estágio inicial. Eles precisam ser capazes de gerar valor rapidamente e ter perspicácia nos negócios para fazer as perguntas certas. Eles devem ser capazes de abordar os dados de maneira 80/20 para fornecer resultados imediatos, em vez de mergulhar nos problemas mais difíceis que você tem.
Para o lado da engenharia de dados, é comum contratar um consultor ou empreiteiro para ajudar a configurar sua arquitetura. Decidimos complementar nossa primeira contratação com um consultor. Dessa forma, temos o melhor dos dois mundos – um especialista em engenharia de dados em meio período e um generalista que pode manter a arquitetura de dados no dia a dia. Estabelecemos bases sólidas e também mantivemos nosso conhecimento em casa.
Mesmo que você não possa contratar imediatamente para todas as funções que deseja em sua equipe de dados a longo prazo, você pode fazer muito com apenas uma ou duas das pessoas certas. A chave é pensar em termos de escalabilidade e eficiência. O que ajuda sua equipe de dados a fazer mais com menos? E como isso vai funcionar quando sua equipe for maior?
Análises escaláveis são extremamente importantes com uma equipe de dados pequena. Ao pensar antecipadamente sobre como seus processos e fluxos de trabalho funcionarão à medida que sua equipe cresce, você economizará tempo e criará soluções valiosas para alguns dos problemas que mais consomem tempo de seus funcionários.
Por exemplo, percebemos imediatamente que nossa equipe de vendas não tinha visibilidade sobre o uso de produtos de clientes em potencial e isso aconteceria com frequência. Por isso, criamos um painel de espaço de trabalho para nossos representantes de vendas para que eles próprios possam obter os dados. O trabalho da nossa equipe de dados é permitir a tomada de decisões orientada por dados. Quando vimos uma oportunidade para um investimento único em dados que poderia levar a centenas de horas economizadas no lado das vendas, agimos de acordo.
Uma pequena equipe de dados também deve se concentrar na prevenção de problemas no futuro. Se você tiver apenas uma equipe de dados de uma pessoa no momento, mantenha-os focados em seus maiores problemas, mas também reserve um tempo para manter e dimensionar sua arquitetura de dados para reduzir a dívida de tecnologia.
Desde o início, nosso objetivo era pensar no futuro em todas as decisões.
Como todas as startups, queríamos gerar ROI imediato. Usamos um data warehouse centralizado que é nossa única fonte de verdade – nada prejudica mais as equipes de dados do que ter dados fragmentados ou não confiáveis. Podemos consolidar nossos dados graças a automações e integrações.
Isso nos ajuda a fornecer insights valiosos para toda a empresa com baixa elevação.
Nós canalizamos todos os nossos dados usando ferramentas ELT como Segment (que também é nossa ferramenta de coleta de dados), Fivetran e estágios externos Snowflake.
Nós usamos
Usamos o Census para enviar nossos dados de depósito de volta para lugares como HubSpot e Courier. Isso permite que nossas equipes de vendas e marketing acessem essas informações na plataforma que estão usando diariamente.
Metabase é a nossa ferramenta de BI. Ele nos permite criar painéis, escrever consultas SQL e fornecer um formato de autoatendimento para usuários não técnicos. Descobrimos que criar esses tipos de painéis de dados de autoatendimento permite que os usuários respondam a muitas de suas próprias perguntas. Eles são rápidos para crescer sem grandes investimentos iniciais, como equipes que usam o Looker ou o Tableau.
Por exemplo, temos um traço de KPI que mostra as principais métricas da empresa. Também podemos acompanhar o desempenho de espaços de trabalho individuais e identificar espaços de trabalho que podemos direcionar para nossa equipe de vendas. Também trouxemos a tomada de decisões baseada em dados para o desenvolvimento de nossos produtos, mergulhando profundamente no uso de produtos de nossos clientes. Um exemplo é que descobrimos que muitos de nossos usuários estavam criando sua própria instância Courier em vez de ingressar na instância Courier existente de seus colegas. Usando esse insight, nossa equipe de produto voltou à prancheta para criar uma página que mostra os espaços de trabalho do Courier criados pelo mesmo domínio de e-mail comercial para que você possa solicitar acesso com facilidade.
Também usamos o Propel para potencializar nossa análise no aplicativo para fornecer visibilidade aos nossos usuários finais. Uma maneira de usar o Propel é fornecer análises de modelo para nossos clientes de nível empresarial. O Propel permite que nossos engenheiros coloquem facilmente visualizações GraphQL sobre nossas métricas de nosso armazém.
Agora, estamos entrando em um período de crescimento, então, naturalmente, estamos evoluindo nossa abordagem de dados novamente. Nosso objetivo atual é permitir que nossos cientistas de dados desenvolvam experiência no assunto enquanto ainda mantêm padrões de dados centralizados.
Nossa estrutura atual é centralizada, com um engenheiro analítico sênior se reportando ao chefe de dados. Funciona agora, pois ainda estamos nos estágios iniciais de criação de uma equipe de dados. Mas quando a equipe se expandir, faremos a transição para um modelo híbrido.
Os cientistas de dados cobrirão certas áreas de negócios (como a equipe de produto), mas ainda se reportarão ao chefe de dados. Isso permitirá que os cientistas de dados desenvolvam experiência no assunto enquanto ainda mantêm padrões de dados centralizados à medida que continuamos a crescer. Como a equipe de dados sempre estará mudando e crescendo junto com o restante da organização, você precisa de padrões que se adaptem aos negócios.
Se você quiser saber mais sobre como abordamos a padronização de dados, confira nossa postagem no blog em