Gangguan Massal Canva hingga Zoom, AWS Ungkap Biang Keroknya

Uzone.id— Pekan lalu,gangguan massal jaringan AWS menyebabkan ratusan aplikasi di seluruh duniadown. Kejadian ini disebut sebagai ‘kiamat internet kecil’ karenaaplikasi-aplikasi seperti Reddit, Canva, Zoom hingga Snapchat mengalami tidakbisa diakses oleh pengguna di seluruh dunia.
Kejadian ini terjadi pada Senin, (20/10) dan berlangsungkurang lebih 15 jam dan mulai kembali normal untuk sebagian aplikasi padakeesokan harinya.
Kurang dari sepekan dari insiden ini, Amazon pun membagikanrincian lengkap mengenai peristiwa yang menyebabkan gangguan besar ini.
Total layanan yang terdampak dari gangguan ini adalah lebihdari 2.000 layanan dan mengakibatkan lebih dari 16 juta laporan pengguna yangkesulitan mengakses layanan di 60 negara.
Amazon mengungkapkan bahwa masalah tersebut terjadi dicluster pusat data terbesar mereka, US-East-1 yang berada di Virginia Utara,Amerika Serikat. Masalah ini "dipicu oleh kerusakan tersembunyi"dalam sistem Domain Name System (DNS) DynamoDB milik perusahaan.
Ini artinya sistem tersebut tidak lagi dapat membagikaninformasi penting yang dibutuhkan untuk menghubungkan pelanggan ke layanan yangmenggunakan Amazon Web Services (AWS).
Sebagai informasi, sistem DNS sendiri berfungsi sebagai bukutelepon internet, dimana mereka menghubungkan nama situs web sepertiAmazon.comdan lainnya dengan alamat IP agarperangkat pengguna terhubung dengan layanan.
Dalam kasus ini, terdapat bug di sistem DNS yang gagalmemperbaiki secara otomatis dan akibatnya, gangguan kecil itu menyebar kebagian lain dari platform AWS, sehingga menimbulkan efek berantai danmenyebabkan gangguan besar di berbagai layanan Amazon Web Services.
Analis memperkirakan total biaya gangguan tersebut bisamencapai miliaran dolar. Di X, banyak yang menyoroti bahwa peristiwa inimerupakan contoh banyaknya perusahaan internet terkemuka yang bergantung padasatu penyedia cloud.
Tak lama dari kejadian ini, Amazon pun meminta maaf padapara pengguna dan berjanji untuk "melakukan segala upaya untuk belajardari peristiwa ini.
"Kami menyadari bahwa peristiwa ini berdampaksignifikan bagi banyak pelanggan,” kata pihak Amazon.
Mereka melanjutkan, “Meskipun kami memiliki rekam jejak yangkuat dalam mengoperasikan layanan dengan tingkat ketersediaan tertinggi, kamimenyadari betapa pentingnya layanan kami bagi pelanggan kami, aplikasi mereka,pengguna akhir, dan bisnis mereka.”