すべてをテストします。リスクは何もありません。自信を持ってアップグレードしてください。
注: Rediaccはまだ本番顧客がありません。これはアーキテクチャがこのシナリオをどのように処理するかを実際に示す使用例であり、実際のデプロイメントからのケーススタディではありません。
危機シナリオ: データベースのアップグレード中に、予期しないエラーが発生し、古いバージョンに戻すことも新しいバージョンに進むこともできなくなりました。顧客はシステムにアクセスできなくなり、5000人以上の従業員が仕事ができなくなりました。唯一の解決策はシステム全体を復元することで、ビジネスがオフラインの間、エンジニアの時間がかかりました。
問題
Mehmetは、チームがオフラインにできない本番データベースを管理しています。彼は今、100 TB PostgreSQLデータベースをバージョン13から14にアップグレードしようとしています。彼の計画:
- バックアップを取る → ただし、データサイズが大きいため、バックアップには数日かかります
- 週末にアップグレードを実行 → 部門は土曜日01:00~05:00の機能停止について通知されます
危機の影響
- アップグレード中に予期しないエラーが発生します
- データベースは古いバージョンに戻すことも新しいバージョンに進むこともできません
- 外部のサポートチームでも問題を解決できません
影響:
- 顧客は支払いと注文システムにアクセスできません
- 組織の従業員(5000人以上)は仕事ができません
- 評判の低下と苦情の増加が始まります
一時的な解決策:
- 最後のバックアップは新しいサーバーにロードされます → ハードウェアコストが2倍になります
- 木曜日と金曜日のデータはライブ環境のみにあるため、データ損失が発生します
- 異なるバージョンの2つのデータベースが作成されます → 矛盾が増加します
Rediaccソリューション
Rediaccではこのように変わります:
1. インスタントクローン作成
- 100 TBのデータベースのクローンが数秒以内に作成されます
- アップグレードテストはライブシステムに影響を与えることなく実行されます
2. 時間ごとのスナップショット
- アップグレードプロセス中にどのステップが何時から失敗しているかが判断されます
- 問題のある操作は事前に特定され、修正されます
3. シームレスなアップグレード
- アップグレードが失敗した場合でも、ライブ環境は影響を受けません
- アップグレードが成功すると、新しいライブ環境が最新のクローンになります
結果
時間とコストの節約:
- バックアップ時間が7日から10秒に短縮されました
リスクのないアップグレード:
- テスト環境で事前にエラーが検出されました → ライブシステムに問題ありません
ゼロダウンタイム:
- 顧客と従業員は何の支障も感じませんでした