Werner Vogels yang merupakan vice president Amazon mengatakan everything fails, all the time atau setiap hal mengalami kegagalan-kegagalan, di setiap waktu. Hal itu yang menjadi dasar bahwa persiapan saat menghadapi kegagalan adalah penting. Perencanaan juga terbagi berdasarkan jenis bencananya, skala kecil, besar, atau kolosal. Yang dimaksud kegagalan ini tidak hanya perangkat keras tetapi juga perangkat lunak.
Recovery Point Objective (RPO) merupakan jumlah kehilangan data yang dapat diterima dalam waktu tertentu, sedangkan Recovery Time Objective (RTO) adalah waktu yang diperlukan setelah gangguan untuk memulihkan proses bisnis sehingga pulih seperti semula. Kedua hal itu dipertimbangkan untuk meminimalisir kehilangan bisnis dan reputasi yang buruk. Penyimpanan merupakan kunci dari disaster recovery, AWS menawarkan berbagai strategi dalam melakukan penyimpanan, yaitu:
- Amazon S3, mengaktifkan cross-region replication
- Amazon S3 Glacier, memang tujuannya untuk pengarsipan dan pencadangan
- Amazon EBS, membuat snapshot point-in-time
- Amazon Snowball, menduplikasi secara manual
- Amazon Sync, menyinkronkan file di on-premise atau cloud dengan Amazon Elastic File System
Jika sebelumnya telah dibahas menangani bencana untuk penyimpanan dan komputasi, maka sekarang muncul pertanyaan layanan apa yang menangani bencana untuk jaringan. Jawabannya adalah Amazon Route 53 (kemampuan mengalihkan operasi), Elastic Load Balancing (fault tolerance yang besar untuk mengatasi lalu lintas yang masuk), Amazon VPC (memperluas topologi jaringan), dan AWS Direct Connect. Pada database tentu saja layanan untuk menangani bencana dimiliki oleh Amazon RDS (snapshot region berbeda, read replica multi-AZ, hingga automated backup) dan Amazon DynamoDB (backup table dalam hitungan detik).
- Backup and Restore
- Mengirim data keluar lokasi dengan memanfaatkan layanan Amazon S3. Backup Data on-Premise ke AWS dapat dilakukan melalui AWS Storage Gateway. Di AWS Storage Gateway itu terdapat 3 penyimpanan antarmuka, yaitu file gateway (protokol file NFS dan SMB, dapat langsung diakses S3), volume gateway (protokol iSCSI, bisa menggunakan cached volume (lebih hemat biaya) atau stored volume (latensi rendah)), dan tape gateway (protokol iSCSI Virtual Tape Library, bisa diarsipka ke Amazon S3 atau Glacier). Untuk mengimplementasikan AWS Storage Gateway ada 2 pendekatan yaitu menyimpan langsung ke Amazon S3 melalui panggilan API ke layanan AWS dan permintaan HTTP PUT dan GET melalui internet.
- Pilot Light
- Cara kerja dari strategi ini adalah ketika bencana terjadi di lingkungan on-premise maka sistem akan mengalihkan operasinya ke Pilot Light AWS. Langkahnya adalah buat instance EC2 untuk replikasi, kelola Amazon Machine Image (AMI), secara berkala jalankan-atur-perbarui software, dan pertimbangkan penggunaaan sumber daya yang otomatis.
- Fully Working Low-Capacity Standby
Mirip seperti pilot light namun dengan level lebih lanjut yaitu adanya sumber daya yang standby. Persiapan awalnya sama dengan pilot light, semua komponen diperlukan berjalan 24/7 tetapi untuk bagian production tidak di-scale, uji secara berkala, dan alihkan sebagian kecil traffic production ke situs disaster recovery.
sumber: anonim - Multi-Site Active-Active
![]() |
| sumber: anonim |
Tipe dari disaster yang terjadi ada 7, yaitu cyber attacks, software (IT system error), hardware issues, network failure, on-premises data center failure, on-premises power outage, dan natural disaster. Tipe disaster tersebut akan membuat downtime yang memiliki 2 akibat, yaitu cost labor dan cost revenue. Setiap karyawan dalam sebuah perusahaan tentu digaji, walaupun dalam hitungan bulan namun dapat di-breakdown menjadi hitungan menit sehingga bisa dihitung jika terjadi downtime dalam hitungan menit. Begitu pula revenue yang dapat dihitung per tahun kemudian di-breakdown menjadi hitungan hari hingga menit.
![]() |
| Sumber: https://event.cloudcomputing.id/live |
Di atas adalah flow service provider Acronis untuk menangani disaster. Layanan disaster tersebut di luar AWS. Acronis merupakan sebuah perusahaan yang memiliki full stack cyber protection untuk mencegah terjadinya downtime.
ref:






Komentar