paint-brush
사용량이 많은 날에 인프라를 30배 확장하기 위한 5가지 팁~에 의해@dmitryshesternin
329 판독값
329 판독값

사용량이 많은 날에 인프라를 30배 확장하기 위한 5가지 팁

~에 의해 Dmitry Shesternin5m2023/09/18
Read on Terminal Reader
Read this story w/o Javascript

너무 오래; 읽다

블랙 프라이데이와 사이버 먼데이 매장 내 트래픽은 38% 증가한 것으로 나타났습니다. 단 몇 분의 가동 중지 시간에도 수천 달러의 비용이 발생할 수 있으므로 기업은 사용량이 많은 날에 대비하여 인프라를 준비해야 합니다. 현지 브랜드와 화훼 업체의 글로벌 마켓플레이스인 Flowwow에는 트래픽이 30배 증가하는 3~4일의 성수기(발렌타인데이, 어머니날)가 있습니다.
featured image - 사용량이 많은 날에 인프라를 30배 확장하기 위한 5가지 팁
Dmitry Shesternin HackerNoon profile picture


SalesCycle에 따르면 블랙 프라이데이와 사이버 먼데이 매장 내 트래픽은 38% 증가한 것으로 나타났습니다. 단 몇 분의 가동 중지 시간에도 수천 달러의 비용이 발생할 수 있으므로 기업은 사용량이 많은 날에 대비하여 인프라를 준비해야 합니다. 지난 몇 년 동안 Walmart, J. Crew, Lowe's 및 GAME을 포함한 많은 대형 브랜드는 팀이 블랙 프라이데이를 맞이할 준비가 되어 있지 않았기 때문에 많은 돈을 잃었고 고객의 신뢰를 무너뜨렸습니다. 38% 증가로 돌아가서 이러한 변화는 기업이 주문 흐름을 따라가고 고객 경험을 극대화하며 부정적인 피드백을 최소화하기 위해 제공되는 서비스와 확장성에 대한 변함없는 관심을 요구합니다.


현지 브랜드와 화훼 업체의 글로벌 마켓플레이스 인 Flowwow 에는 트래픽이 30배 증가하는 3~4일의 성수기(발렌타인데이, 어머니날)가 있습니다. 우리 IT 팀은 서비스 확장, 관리, 피크타임이 끝나면 마무리하는 데 도움이 되는 유연한 시스템을 개발했습니다.


이 기사에서는 대규모 확장을 위해 서비스를 준비하고 전자상거래 플랫폼에서 흔히 발생하는 실수를 방지하는 데 도움이 되는 5가지 팁을 공유합니다.

기획이 핵심이다

어떤 조치를 취하기 전에, 피크일 1개월 전, 피크일 2주 전, 피크일 3~4일 전, 피크일 1일 전 등 여러 단계로 나누어 세부적인 확장 계획을 개발하고 구현합니다. 팀의 작업 목록. 모든 단계에서 지정된 전문가가 각 작업을 수행하고 잠재적인 문제를 해결하는 방법을 이해하는 것이 중요합니다. 이러한 팀은 일반적으로 DevOps 팀과 백엔드 개발자로 구성됩니다.


피크 시간대의 트래픽은 30배 증가할 수 있습니다.

#1 데이터 예측

매년 총 주문량이 증가하고 있습니다. 이는 놀라운 일이 아니며, 따라서 트래픽 양을 예측하고 이에 대비하는 것이 중요합니다. 과거 데이터와 마케팅팀과의 부서 간 협업은 정확한 예측을 위한 핵심 요소입니다. 이는 어떤 시스템 구성 요소가 확장될 수 있는지 이해하고 서버 수와 용량을 결정하는 데 도움이 됩니다.


예상 수치를 평가한 후 예측에 2X를 입력하세요. 30배 성장을 예측한다면 60배 증가에 대비하도록 작업을 설정하세요. 이 접근 방식을 사용하면 예상치 못한 문제에 대비할 수 있습니다. 클라우드 스케일링이 있는 경우 단기간에 용량을 획기적으로 늘린 다음 필요할 때 일반 지표로 줄일 수 있는 도구가 있습니다.


기본 매개변수를 기반으로 인프라 검색 분석을 수행합니다. 즉, 서버, 현재 크기, 구성 요소, 프로젝트 및 애플리케이션을 매핑합니다. 기본 매개변수를 이해하면 추정에 도움이 됩니다. 성장을 예측하고 실제로 60X인 경우 잠재적인 시나리오를 계산합니다.


모든 오류에 규칙 30X를 적용합니다. 오류를 발견하면 "이 오류가 30배 더 자주 나타나기 시작하면 우리에게 문제가 될까요?"라고 자문해 보세요. 30X 트래픽의 오류를 지금 바로잡을 가치가 있다면 작업을 시작하세요.

#2 비즈니스 요청으로부터 확장 팀을 보호하세요

개발 팀의 규모가 충분하지 않으면 모든 사람의 할 일 목록이 꽉 찼을 가능성이 높습니다. 따라서 피크 기간에만 초점을 맞추는 별도의 내부 개발 팀을 구성할 필요가 있습니다. 이 팀은 다른 비즈니스 요청에서 벗어나 최적화 작업만 처리해야 합니다. 파레토 원칙은 여기서 잘 작동합니다. 병목 현상의 20%를 최적화한다는 것은 코드와 데이터베이스의 성능 문제의 80%를 해결한다는 의미입니다.


기능 동결(팀이 새 기능을 추가하지 않는 기간)을 알리고 가급적 한 달 전에 팀에 이를 상기시키는 것을 잊지 마세요. 이 기간 동안에는 코드나 데이터베이스를 변경하는 것을 허용하지 않습니다. 왜냐하면 변경이 이루어지면 전체 시스템이 중단될 수 있고 이 오류로 인한 비용이 당시 30배 증가하기 때문입니다.

#3 병목 현상을 찾아 최적화를 시작하세요

병목 현상은 현재 인프라를 최적화하는 데 필요한 메커니즘을 보여줍니다. 우리는 현재 시스템 구성 요소를 여러 영역으로 나누어 별도로 모니터링합니다. 이를 통해 각 서버의 성능을 평가하고 어떤 구성 요소에 더 많은 리소스가 필요한지 이해할 수 있습니다. 이 접근 방식은 리소스를 유연하게 계획하는 데 도움이 됩니다. 각 구성 요소의 성능을 실시간으로 평가할 수 있는 고급 모니터링 시스템과 로그 집계를 사용하여 모든 오류를 포착합니다(나중에 수정할 수 있음).


파레토 원칙은 여기서 잘 작동합니다. 병목 현상의 20%를 최적화한다는 것은 코드와 데이터베이스의 성능 문제의 80%를 해결한다는 의미입니다.

#4 맞춤형 스트레스 테스트 수행

잠재적인 고객 행동을 모방하여 스트레스 테스트를 미리 수행하십시오. 예를 들어 평소의 10배에 달하는 인프라 로드 시뮬레이션부터 시작하세요. 얻은 데이터를 바탕으로 어떤 영역에 최적화가 필요한지 파악합니다. 시스템이 특정 수준의 압력을 견딜 수 있는지 평가하고 확인하기 위해 한 시간의 로드를 10배 더 빠르게 플레이할 수 있는 특수 도구가 있습니다.

#5 X일 계획

부하가 최고조에 달하는 동안 우리는 각 팀 구성원의 작업량을 세심하게 계획하여 핵심 역할을 할당하고 책임을 분배합니다. 우리는 직원들을 배려하며 모든 사람이 건강한 수면을 취할 수 있도록 보장합니다. 동시에 최대 시간대를 커버하기 위해 노력합니다. 각 단계에서 우리는 가장 중요한 순간에 무슨 일이 일어나고 있는지 모니터링하는 프로세스 관리자를 지명합니다. 시스템 구성 요소 중 하나가 성능 한계(80%)에 도달하면 팀에 알리는 사람이 바로 이 사람입니다.


원격으로 일하다 보니 Day X가 오면 Slack과 같은 업무용 메신저뿐만 아니라 텔레그램, 개인 전화 등 비상 통신 채널을 통해 팀 전체가 연락을 유지하는 것이 중요합니다.


블랙 프라이데이, 사이버 먼데이, 크리스마스와 같은 성수기는 준비해야 할 활동적인 단계입니다. 더 많은 트래픽은 귀하의 비즈니스에 더 많은 가치를 의미합니다. 이는 일반적으로 수익 증가로 나타납니다. 그렇기 때문에 주저하지 말고 확장에 투자하고, 국제 원칙을 준수하고, 현대적인 서비스를 구현하세요. 현재 귀하의 비즈니스 요구 사항을 충족하는 새로운 솔루션을 주시하고 서비스 혜택에 맞게 확장하세요!