AWS Pulih Seribu Perusahaan Tetap Was-was
Layanan cloud Amazon Web Services (AWS) telah pulih sepenuhnya usai mengalami down sejak Senin (20/10) sore dan menyebabkan gangguan pada berbagai platform global, seperti Snapchat, Signal, Reddit, dan game populer Roblox.
Hingga saat ini, Amazon mengumumkan bahwa beberapa layanan AWS mengalami penumpukan pesan yang memerlukan waktu beberapa jam untuk diproses. Kendati demikian perusahaan yang menggunakan fasilitas AWS masih tetap was-was.
AWS menghosting aplikasi dan proses komputasi untuk perusahaan di seluruh dunia, dan gangguan tersebut membuat pekerja dari London hingga Tokyo terputus dari jaringan dan menghentikan aktivitas bisnis mereka, mulai dari membayar penata rambut hingga mengubah tiket pesawat.
Keluhan datang dari pengguna di berbagai platform, mulai dari pengguna dompet digital Venmo hinga platform panggilan video Zoom.
Ini disebut sebagai gangguan internet terbesar sejak kegagalan CrowdStrike tahun lalu yang mengganggu sistem teknologi di rumah sakit, bank, dan bandara, menyoroti kerentanan teknologi terhubung di seluruh dunia.
Ini setidaknya merupakan kali ketiga dalam lima tahun terakhir kluster AWS di Virginia Utara, yang dikenal sebagai US-EAST-1, berkontribusi pada gangguan internet besar-besaran.
Amazon tidak menanggapi permintaan untuk penjelasan lebih lanjut mengenai mengapa pusat data tersebut terus mengalami gangguan.
Namun, mereka menyebut masalah ini berasal dari sistem Domain Name System (DNS), yang mencegah aplikasi menemukan alamat yang benar untuk AWS DynamoDB API, sebuah basis data awan yang digunakan untuk menyimpan informasi pengguna dan data kritis lainnya.
Ookla mengatakan setidaknya seribu perusahaan terdampak oleh gangguan tersebut.
Aplikasi yang terdampak di di antaranya Reddit, Roblox, Snapchat, dan Duolingo terdampak.
Startup kecerdasan buatan Perplexity, bursa kripto Coinbase, dan aplikasi perdagangan Robinhood juga mengalami gangguan platform dan mengaitkannya dengan AWS.
Layanan Amazon sendiri, termasuk situs belanja, Prime Video, dan Alexa, juga terkena dampak gangguan tersebut.
Selain Roblox, Fortnite milik Epic Games, Clash Royale, dan Clash of Clans juga menjadi platform game yang terkena dampak.
Dalam posting di X, Presiden Signal Meredith Whittaker mengonfirmasi bahwa aplikasi pesan tersebut terkena gangguan.
Akar masalah
Sebelumnya, AWS menyatakan bahwa penyebab utama gangguan tersebut adalah subsistem dasar yang memantau kesehatan load balancer jaringan AWS yang digunakan untuk mendistribusikan lalu lintas ke beberapa server.
Masalah tersebut, kata AWS, berasal dari dalam "jaringan internal EC2", layanan "Elastic Compute Cloud" Amazon, yang menyediakan kapasitas cloud on-demand di dalam AWS.
Sekitar pukul 3 sore PT (05.00 WIB), Amazon mengatakan, "semua layanan AWS kembali beroperasi normal. Beberapa layanan seperti AWS Config, Redshift, dan Connect masih memiliki tumpukan pesan yang akan diproses dalam beberapa jam ke depan."
Ken Birman, profesor ilmu komputer di Cornell University, mengatakan pengembang perangkat lunak perlu membangun ketahanan masalah yang lebih baik.
Dia mengatakan AWS harusnya menyediakan alat yang dapat digunakan pengembang untuk melindungi diri mereka jika terjadi masalah di salah satu dari jaringan pusat data yang luas miliknya, dan pengembang juga dapat membuat cadangan dengan penyedia cloud lain.
"Ketika orang memotong biaya dan mengambil jalan pintas untuk mencoba mengaktifkan aplikasi, lalu lupa bahwa mereka melewatkan langkah terakhir dan tidak benar-benar melindungi diri dari gangguan, perusahaan-perusahaan itulah yang seharusnya diperiksa lebih lanjut," kata Birman, dikutip dari Reuters.
(lom/mik)