SalesCycle によると、ブラック フライデーとサイバー マンデーの店内客数は38% 増加しました。数分のダウンタイムでも数千ドルの損失が発生する可能性があるため、企業はピーク日にインフラストラクチャを準備する必要があります。ここ数年、 ウォルマート、J.クルー、ロウズ、ゲームを含む多くの大手ブランドは、チームがブラックフライデーに向けた準備ができていなかったため、多額の損失を被り、顧客の信頼を傷つけました。 38% の増加に戻ると、このような変化には、企業が注文の流れに追いつき、顧客エクスペリエンスを最大化し、否定的なフィードバックを最小限に抑えるために、提供されるサービスとその拡張性に対する揺るぎない注意が求められます。
地元ブランドや花関連企業の世界的なマーケットプレイスであるFlowwow には、トラフィックが 30 倍に増加する独自のピーク日 (バレンタインデー、母の日) が 3 ~ 4 日あります。当社の IT チームは、サービスの拡張、管理、ピーク日の終了時にサービスを終了するのに役立つ柔軟なシステムを開発しました。
この記事では、サービスの大規模な拡張に向けて準備し、電子商取引プラットフォームでよくある間違いを回避するのに役立つ 5 つのヒントを紹介します。
アクションを起こす前に、詳細なスケーリング計画を作成して実装します。これはいくつかの段階に分けられます。ピーク日の 1 か月前、ピーク日の 2 週間前、ピーク日の 3 ~ 4 日前、およびピーク日の 1 日前です。チームのアクションのリスト。どの段階においても、指定された専門家が各タスクの実行方法と潜在的な問題の解決方法を理解していることが重要です。これらのチームは通常、DevOps チームとバックエンド開発者で構成されます。
注文の総数は毎年増加していますが、これは驚くべきことではありません。そのため、トラフィック量を予測し、それに備えることが重要です。履歴データとマーケティング チームとの部門を超えたコラボレーションは、正確な予測の中核要素です。これらは、どのシステム コンポーネントが増加する可能性があるかを理解し、サーバーの数とその容量を決定するのに役立ちます。
予想される数値を評価したら、予測に 2X を加えます。 30 倍の増加が予測される場合は、60 倍の増加に対応できるようにタスクを設定します。このアプローチにより、予期せぬ課題に対する特別な準備が可能になります。クラウド スケーリングを使用している場合は、短期間で容量を大幅に増やし、必要に応じて通常の指標に減らすためのツールが手に入ります。
基本パラメータに基づいてインフラストラクチャ検出分析を実行します。サーバー、現在のサイズ、コンポーネント、プロジェクト、アプリケーションを計画します。基本的なパラメーターを理解すると、推定に役立ちます。成長を予測し、実際に 60 倍になった場合の潜在的なシナリオを計算します。
すべてのエラーにルール 30X を適用します。エラーを見つけた場合は、「このエラーが 30 倍の頻度で表示されるようになったら、問題になるでしょうか?」と自問してください。 30X トラフィックのエラーが今すぐ修正する価値がある場合は、作業を開始してください。
開発チームの規模が十分でない場合、全員の To Do リストがいっぱいになる可能性が高くなります。したがって、ピーク期間のみに焦点を当てる別の社内開発チームを形成する必要があります。このチームは他のビジネス要求から解放され、最適化タスクのみを扱う必要があります。ここではパレートの法則がうまく機能します。ボトルネックの 20% を最適化することは、コードとデータベースのパフォーマンスの問題の 80% を解決することを意味します。
できれば 1 か月前に、機能の凍結 (チームが新しい機能を追加しない期間) を発表し、チームに通知することを忘れないでください。この期間中はコードまたはデータベースに変更を加えることは許可されません。変更が行われるとシステム全体がダウンし、このエラーによるコストがその時点で 30 倍に増加する可能性があるためです。
ボトルネックは、現在のインフラストラクチャで最適化する必要があるメカニズムを示します。現在のシステムコンポーネントをさまざまな領域に分割し、個別に監視します。これにより、各サーバーのパフォーマンスを評価し、どのコンポーネントがより多くのリソースを必要とするかを理解できるようになります。このアプローチは、リソースを柔軟に計画するのに役立ちます。各コンポーネントのパフォーマンスをリアルタイムで評価できる高度な監視システムを使用し、ログを集約してすべてのエラーを検出します (後で修正できるようになります)。
ここではパレートの法則がうまく機能します。ボトルネックの 20% を最適化することは、コードとデータベースのパフォーマンスの問題の 80% を解決することを意味します。
事前にストレス テストを実行し、潜在的な顧客の行動を模倣してみます。たとえば、通常の 10 倍のインフラストラクチャ負荷をシミュレートすることから始めます。取得したデータに基づいて、どの領域を最適化する必要があるかを理解します。 1 時間の負荷をかけて 10 倍の速さで再生して、システムが一定レベルの圧力に耐えられるかどうかを評価および確認できる特別なツールがあります。
負荷のピーク時には、各チームメンバーの作業負荷を綿密にスケジュールし、主要な役割を割り当て、責任を分散します。当社は従業員を大切にしているため、全員が健康的な睡眠を取れるようにしていますが、同時に最大数のタイムゾーンをカバーするよう努めています。各段階で、ピーク時に何が起こっているかを監視するプロセスマネージャーを指名します。システム コンポーネントの 1 つがパフォーマンス制限 (80%) に近づいた場合にチームに通知するのは、この担当者です。
私たちはリモートで作業しているため、Day X が到来したときに、Slack などの仕事用メッセンジャーだけでなく、Telegram や個人の電話などの緊急通信チャネルを通じてチーム全体が連絡を取り合うことが重要です。
ブラック フライデー、サイバー マンデー、クリスマスなどのピーク日は、準備が必要なアクティブなフェーズです。トラフィックが増えると、ビジネスの価値も高まります。これは通常、収益の増加として現れます。だからこそ、躊躇せずにスケーリングに投資し、国際原則を遵守し、最新のサービスを実装してください。今日のビジネスのニーズを満たし、サービスのメリットに合わせて拡張できる新しいソリューションに注目してください。