paint-brush
在高峰时段将基础设施扩展 30 倍的五个技巧经过@dmitryshesternin
329 讀數
329 讀數

在高峰时段将基础设施扩展 30 倍的五个技巧

经过 Dmitry Shesternin5m2023/09/18
Read on Terminal Reader

太長; 讀書

黑色星期五和网络星期一店内客流量增长了 38%。公司应该为高峰期做好基础设施准备,因为即使是几分钟的停机也会让他们损失数千美元。 Flowwow 是本地品牌和花卉企业的全球市场,有 3-4 个高峰日(情人节、母亲节),流量会增加 30 倍。
featured image - 在高峰时段将基础设施扩展 30 倍的五个技巧
Dmitry Shesternin HackerNoon profile picture


根据 SalesCycle 的数据,黑色星期五和网络星期一店内客流量增长了 38% 。公司应该为高峰期做好基础设施准备,因为即使是几分钟的停机也会让他们损失数千美元。在过去的几年里,许多大品牌,包括沃尔玛、J. Crew、Lowe's 和 GAME ,因为他们的团队没有为黑色星期五做好准备而损失了很多钱并失去了顾客的信任。回到 38% 的增长,这样的变化需要坚定不移地关注所提供的服务及其可扩展性,以便公司跟上订单流,最大限度地提高客户体验,并最大限度地减少他们的负面反馈。


Flowwow 是本地品牌和花卉企业的全球市场,有 3-4 个高峰日(情人节、母亲节),此时流量会增加 30 倍。我们的 IT 团队开发了一个灵活的系统,有助于扩展服务、管理服务并在高峰日结束时结束服务。


在本文中,我将分享五个技巧,这些技巧将帮助您为大规模扩展做好服务准备,并避免电子商务平台常见的错误。

规划是关键

在采取任何行动之前,制定并实施详细的扩展计划,分为几个阶段:高峰日前 1 个月、高峰日前 2 周、高峰日前 3-4 天、高峰日前 1 天,并制定精确的扩展计划。团队的行动清单。在每个阶段,指定的专家了解如何执行每项任务并解决任何潜在问题非常重要。这些团队通常由 DevOps 团队和后端开发人员组成。


我们在高峰日的流量可以增加 30 倍

#1 预测数据

每年订单总数都在增加——这并不奇怪,这就是为什么预测交通量并为此做好准备至关重要。历史数据以及与营销团队的跨职能协作是准确预测的核心要素。它们有助于了解哪些系统组件可以增长,然后决定服务器的数量及其容量。


评估完预期数字后,将 2X 放入预测中。如果您预测增长 30 倍,则将任务设置为准备增长 60 倍。这种方法可以让您为意想不到的挑战做好额外的准备。如果您有云扩展,您就可以使用工具在短时间内大幅增加容量,然后在需要时将其减少到常规指标。


根据基本参数(绘制服务器、其当前大小、组件、项目和应用程序)进行基础设施发现分析。了解基本参数有助于推断:您可以预测增长并计算潜在场景,以防增长确实达到 60 倍。


将规则 30X 应用于所有错误。如果您发现错误,请问问自己:“如果此错误开始出现的频率增加 30 次,这会对我们造成问题吗?”如果 30X 流量上的错误值得立即纠正,请开始处理它。

#2 保护您的扩展团队免受业务请求的影响

当你的开发团队不够大时,每个人的待办事项列表很可能都被填满了。因此,有必要组建一个独立的内部开发团队,专注于高峰期:该团队应该不受其他业务请求的影响,只处理优化任务。帕累托原则在这里很有效:优化 20% 的瓶颈意味着解决代码和数据库中 80% 的性能问题。


不要忘记宣布功能冻结(您的团队不会添加新功能的时期)并提醒团队,最好提前一个月。我们不允许在此期间对代码或数据库进行更改,因为一旦更改,整个系统可能会崩溃,并且此错误的成本当时会增加30倍。

#3 找到瓶颈并开始优化

瓶颈显示了您当前基础设施中需要优化的机制。我们将当前的系统组件划分为不同的区域并分别进行监控。它使我们能够评估每台服务器的性能,并了解哪些组件需要我们更多的资源——这种方法有助于灵活地规划我们的资源。使用先进的监控系统,能够实时评估每个组件的性能,并通过日志聚合来捕获所有错误(以便您稍后可以修复它们)。


帕累托原则在这里很有效:优化 20% 的瓶颈意味着解决代码和数据库中 80% 的性能问题。

#4 进行个性化压力测试

提前进行压力测试,尝试模仿您的潜在客户行为。首先模拟基础设施负载,例如通常的 10 倍。根据获得的数据,我们了解哪些领域需要优化。有一些特殊的工具可以让您以 10 倍的速度加载一个小时,以评估并确认系统是否可以承受一定程度的压力。

#5 X 天的计划

在高峰负载期间,我们精心安排每个团队成员的工作量,分配关键角色并分配职责。我们确实关心我们的员工,这就是为什么我们确保每个人都有健康的睡眠时间,但是,我们也努力覆盖最大数量的时区。在每个阶段,我们都会指定一名流程经理,负责监控高峰时刻发生的情况。如果系统组件之一接近性能限制 (80%),则由此人通知团队。


当我们远程工作时,当第 X 天到来时,整个团队不仅通过 Slack 等工作通讯工具保持联系,而且还通过 Telegram 和个人电话等紧急通信渠道保持联系,这一点至关重要。


黑色星期五、网络星期一和圣诞节等高峰日是您应该做好准备的活跃阶段。更多流量意味着您的业务价值更高。反过来,这通常会表现为收入增加。这就是为什么要毫不犹豫地投资于扩展、遵守国际原则并实施现代服务。密切关注满足您当今业务需求的新解决方案,并根据您的服务优势进行扩展!