paint-brush
Cinco dicas para dimensionar sua infraestrutura em 30 vezes em dias de picopor@dmitryshesternin
354 leituras
354 leituras

Cinco dicas para dimensionar sua infraestrutura em 30 vezes em dias de pico

por Dmitry Shesternin5m2023/09/18
Read on Terminal Reader

Muito longo; Para ler

O tráfego nas lojas da Black Friday e da Cyber Monday mostra um aumento de 38%. As empresas devem preparar a sua infraestrutura para os dias de pico, pois mesmo alguns minutos de inatividade podem custar-lhes milhares de dólares. Flowwow, um mercado global de marcas locais e negócios florais, tem seus próprios 3-4 dias de pico (Dia dos Namorados, Dia das Mães), quando o tráfego aumenta 30 vezes.
featured image - Cinco dicas para dimensionar sua infraestrutura em 30 vezes em dias de pico
Dmitry Shesternin HackerNoon profile picture


De acordo com o SalesCycle, o tráfego na loja da Black Friday e da Cyber Monday apresenta um aumento de 38% . As empresas devem preparar a sua infraestrutura para os dias de pico, pois mesmo alguns minutos de inatividade podem custar-lhes milhares de dólares. Nos últimos anos, muitas grandes marcas, incluindo Walmart, J. Crew, Lowe's e GAME , perderam muito dinheiro e quebraram a confiança dos seus clientes porque as suas equipas não estavam preparadas para a Black Friday. Voltando ao aumento de 38%, tal mudança exige atenção inabalável ao serviço prestado e à sua escalabilidade para que as empresas acompanhem o fluxo de pedidos, maximizem a experiência dos clientes e minimizem o seu feedback negativo.


Flowwow, um mercado global de marcas locais e negócios florais, tem seus próprios 3-4 dias de pico (Dia dos Namorados, Dia das Mães), quando o tráfego aumenta 30 vezes. Nossa equipe de TI desenvolveu um sistema flexível que ajuda a dimensionar o serviço, gerenciá-lo e finalizá-lo quando o dia de pico terminar.


Neste artigo, estou compartilhando cinco dicas que ajudarão a preparar seu serviço para uma escalabilidade massiva – e evitar erros, comuns em plataformas de e-commerce.

Planejamento é a chave

Antes de qualquer ação, desenvolva e implemente um plano de escala detalhado, dividido em várias etapas: 1 mês antes de um dia de pico, 2 semanas antes de um dia de pico, 3-4 dias antes de um dia de pico e 1 dia antes de um dia de pico com um valor preciso. lista de ações para as equipes. Em todas as etapas, é importante que os especialistas designados entendam como realizar cada tarefa e resolver qualquer problema potencial. Essas equipes geralmente consistem em uma equipe DevOps e desenvolvedores back-end.


Nosso tráfego em dias de pico pode aumentar 30X

Nº 1 Preveja os dados

Todos os anos o número total de encomendas aumenta – o que não é nenhuma surpresa, e é por isso que é vital prever o volume de tráfego e estar preparado para isso. Os dados históricos e a colaboração multifuncional com a equipe de marketing são elementos essenciais para uma previsão precisa. Eles ajudam a entender quais componentes do sistema podem crescer e então decidir sobre o número de servidores e sua capacidade.


Depois de avaliar os números esperados, coloque 2X na previsão. Se você prevê um crescimento de 30X, defina a tarefa para estar pronta para um aumento de 60X. Essa abordagem permite uma preparação extra para desafios inesperados. Se você tiver escalonamento de nuvem, terá as ferramentas para aumentar drasticamente a capacidade em um curto período de tempo e depois reduzi-la para indicadores regulares quando necessário.


Faça uma análise de descoberta de infraestrutura, com base nos parâmetros básicos – mapeie servidores, seu tamanho atual, seus componentes, projetos e aplicações. Compreender os parâmetros básicos ajuda na extrapolação: você está prevendo o crescimento e calculando cenários potenciais caso seja de fato 60X.


Aplique a regra 30X a todos os erros. Se você encontrar um erro, pergunte-se: “Se esse erro começar a aparecer 30 vezes mais, será um problema para nós?” Se vale a pena corrigir um erro no tráfego 30X agora, comece a trabalhar nele.

Nº 2 Proteja sua equipe de escalonamento de solicitações de negócios

Quando sua equipe de desenvolvimento não é grande o suficiente, há grandes chances de que a lista de tarefas de todos esteja lotada. Assim, é necessária a formação de uma equipa de desenvolvimento interna separada, cujo foco estará exclusivamente no período de pico: esta equipa deverá estar livre de outras solicitações de negócio e tratar apenas de tarefas de otimização. O princípio de Pareto funciona bem aqui: otimizar 20% dos gargalos significa fechar 80% dos problemas de desempenho no código e no banco de dados.


Não se esqueça de anunciar o congelamento de recursos (período em que sua equipe não adicionará novos recursos) e lembrar a equipe sobre isso, de preferência com um mês de antecedência. Não permitimos alterações no código ou no banco de dados nesse período porque, quando são feitas alterações, todo o sistema pode cair, e o custo desse erro aumenta 30X na hora.

#3 Encontre gargalos e inicie a otimização

Os gargalos mostram os mecanismos que você precisa otimizar em sua infraestrutura atual. Dividimos os componentes atuais do sistema em diferentes áreas e os monitoramos separadamente. Permite-nos avaliar o desempenho de cada servidor e compreender quais os componentes que necessitam de mais recursos da nossa parte – esta abordagem ajuda a planear os nossos recursos de forma flexível. Use um sistema de monitoramento avançado, capaz de avaliar o desempenho de cada componente em tempo real, e agregação de logs para detectar todos os erros (para que você possa corrigi-los mais tarde).


O princípio de Pareto funciona bem aqui: otimizar 20% dos gargalos significa fechar 80% dos problemas de desempenho no código e no banco de dados.

#4 Realize testes de estresse personalizados

Realize testes de estresse com antecedência, tentando imitar o comportamento do cliente potencial. Comece simulando a carga da infraestrutura, por exemplo, 10X do normal. Com base nos dados obtidos, entendemos quais áreas necessitam de otimização. Existem ferramentas especiais que permitem pegar uma hora de carga e reproduzi-la 10 vezes mais rápido para avaliar e confirmar se o sistema pode suportar um determinado nível de pressão.

Nº 5 Plano para o Dia X

Durante os picos de carga, programamos meticulosamente a carga de trabalho de cada membro da equipe, atribuindo funções-chave e distribuindo responsabilidades. Nós nos preocupamos com nossos funcionários e é por isso que garantimos que todos tenham uma boa noite de sono. No entanto, também nos esforçamos para cobrir o número máximo de fusos horários. Em cada etapa nomeamos um gestor de processos, que monitora o que está acontecendo no momento de pico. É esta pessoa quem informa a equipe caso um dos componentes do sistema se aproxime do limite de desempenho (80%).


Como trabalhamos remotamente, quando chega o Dia X, é fundamental que toda a equipe mantenha contato não só por meio de mensageiros de trabalho como o Slack, mas também por canais de comunicação emergencial, como o Telegram e um telefone pessoal.


Dias de pico como Black Friday, Cyber Monday e Natal são fases ativas para as quais você deve estar preparado. Mais tráfego significa mais valor para o seu negócio. Isto, por sua vez, geralmente se manifesta em aumento de receita. É por isso que não hesite em investir em expansão, aderir aos princípios internacionais e implementar serviços modernos. Fique de olho nas novas soluções que atendam às necessidades do seu negócio hoje e aumente o benefício para o seu serviço!