Vào khoảng 16:00 UTC (23:00 giờ Việt Nam) ngày 29 tháng 10 năm 2025, đã ghi nhận một đợt gián đoạn rất đáng chú ý tại nền tảng đám mây toàn cầu Microsoft Azure kéo theo ảnh hưởng lan rộng đến nhiều dịch vụ liên quan như Microsoft 365, Xbox, Minecraft…
Báo cáo từ theo dõi sự cố như Downdetector cho thấy số lượng người dùng gặp vấn đề từng đạt tới hơn 18 000 lượt báo cáo chỉ riêng với Azure tại một thời điểm.

Nguyên nhân
Microsoft đã công bố rằng sự cố bắt nguồn từ một thay đổi cấu hình vô tình (inadvertent configuration change) trong dịch vụ Azure Front Door (AFD) nền tảng phân phối ứng dụng/lưu lượng toàn cầu của Azure. Cụ thể:
- Có dấu hiệu về vấn đề liên quan tới hệ thống DNS hoặc routing lưu lượng, khiến một phần dịch vụ không còn nhận hoặc phân phối traffic đúng cách.
- Microsoft cho biết họ đang “rollback” (quay lại cấu hình đã biết ổn định) và chuyển lưu lượng sang các node khác để khắc phục.
- Điểm quan trọng: nguyên nhân không phải là tấn công từ bên ngoài (hack) ít nhất theo thông báo ban đầu mà là do vận hành nội bộ và cấu hình.
Ảnh hưởng thực tế
- Hàng loạt dịch vụ bị ảnh hưởng: ngoài Azure, còn có Microsoft 365, Xbox, Minecraft… khiến người dùng và doanh nghiệp gặp khó khăn trong truy cập ứng dụng, quản trị hệ thống hoặc thậm chí điều hành hoạt động kinh doanh thường nhật.
- Doanh nghiệp lớn cũng ghi nhận tác động: Alaska Airlines, Vodafone UK, Sân bay Heathrow… đều nói rằng hệ thống chính bị ảnh hưởng vì vấn đề tại Azure.
- Dù sự cố không kéo dài rất lâu nhưng lại xảy ra tại thời điểm nhạy cảm: ngay trước khi Microsoft công bố báo cáo lợi nhuận quý. Điều này tăng thêm áp lực về uy tín và độ tin cậy.
Phản hồi từ Microsoft và cộng đồng
Ngay sau khi sự cố xảy ra, đội ngũ Microsoft đã cập nhật liên tục trên trang Azure status và kênh X (Twitter) của họ. Họ thừa nhận lỗi đến từ một thay đổi cấu hình, khẳng định không có dấu hiệu tấn công mạng và cam kết tăng cường quy trình kiểm thử thay đổi trong tương lai. Việc công khai sớm nguyên nhân và quá trình khắc phục được nhiều chuyên gia đánh giá là “minh bạch và đúng hướng” dù vẫn còn ý kiến cho rằng Microsoft nên có kế hoạch dự phòng mạnh mẽ hơn cho tầng định tuyến toàn cầu như Front Door.
Về phía người dùng, phản ứng khá chia rẽ. Một số doanh nghiệp lớn tỏ ra thông cảm, cho rằng lỗi cấu hình ở quy mô hàng triệu node là điều có thể xảy ra, số khác lại nhấn mạnh rằng với một nền tảng hạ tầng toàn cầu, “99.99% uptime” không nên đồng nghĩa với nhiều giờ downtime toàn diện.









