AWS: Công bố giảm giá tới 45% cho các phiên bản EC2 sử dụng GPU NVIDIA tăng tốc

Trong bối cảnh nhiều doanh nghiệp trên toàn cầu đang tận dụng trí tuệ nhân tạo sinh (generative AI) trên nền tảng Amazon Web Services (AWS) để nâng cao hiệu suất làm việc, cải thiện trải nghiệm khách hàng và tối ưu quy trình vận hành, nhu cầu về tài nguyên GPU ngày càng tăng mạnh. Tuy nhiên, sự tăng trưởng đột biến này đang vượt xa nguồn cung toàn ngành, khiến GPU trở thành tài nguyên khan hiếm và đẩy chi phí triển khai AI lên cao.

Nhằm giải quyết thách thức chi phí, AWS tiếp tục duy trì cam kết mang lại giá trị tối đa cho khách hàng bằng cách tối ưu chi phí vận hành và chia sẻ lợi ích từ quy mô với người dùng. Việc điều chỉnh giá dịch vụ định kỳ từ lâu đã trở thành một phần trong chiến lược phát triển của AWS.

Mới đây, AWS chính thức công bố mức giảm giá lên đến 45% cho các phiên bản máy chủ EC2 được tăng tốc bởi GPU NVIDIA, bao gồm các dòng P4 (P4d và P4de) và P5 (P5 và P5en). Việc điều chỉnh này áp dụng cho cả hình thức thanh toán theo nhu cầu và theo kế hoạch tiết kiệm (Savings Plan) tại tất cả các khu vực mà các phiên bản này được cung cấp.

Cụ thể, mức giảm giá theo hình thức thanh toán theo nhu cầu sẽ có hiệu lực từ ngày 1 tháng 6, trong khi mức giảm đối với các gói tiết kiệm sẽ được áp dụng kể từ sau ngày 4 tháng 6.

AWS cũng đã công bố bảng chi tiết phần trăm giảm giá dựa trên mức giá hiện hành tại thời điểm ngày 31 tháng 5 năm 2025, theo từng loại phiên bản và hình thức thanh toán.

Instance type	NVIDIA GPUs	On-Demand	EC2 Instance Savings Plans		Compute Savings Plans
Instance type	NVIDIA GPUs	On-Demand	1 year	3 years	1 year	3 years
P4d	A100	33%	31%	25%	31%	–
P4de	A100	33%	31%	25%	31%	–
P5	H100	44%	–	45%	44%	25%
P5en	H200	25%	–	26%	25%	–

Amazon Web Services đang mở rộng khả năng tiếp cận dịch vụ điện toán GPU cho khách hàng trên toàn cầu thông qua việc điều chỉnh mô hình định giá và tăng cường khả năng cung cấp tài nguyên. Trước bối cảnh nhu cầu sử dụng GPU ngày càng gia tăng nhưng nguồn cung toàn ngành lại hạn chế, AWS đã triển khai nhiều giải pháp để giúp khách hàng tối ưu chi phí trong khi vẫn tiếp cận được sức mạnh tính toán phục vụ cho trí tuệ nhân tạo và máy học.

Một trong những chương trình nổi bật là Savings Plans. Đây là mô hình định giá linh hoạt cho phép khách hàng nhận được mức giá thấp hơn so với hình thức tính phí theo giờ thông thường nếu cam kết sử dụng tài nguyên điện toán ở mức độ ổn định trong một khoảng thời gian xác định kéo dài từ một đến ba năm. Savings Plans được thiết kế để phù hợp với nhu cầu sử dụng đa dạng của khách hàng.

Savings Plans hiện có hai lựa chọn chính. Loại thứ nhất là EC2 Instance Savings Plans, dành cho khách hàng cam kết sử dụng một họ máy cụ thể trong một vùng địa lý xác định, ví dụ như dòng máy P5 tại khu vực miền Đông Hoa Kỳ. Loại thứ hai là Compute Savings Plans, cung cấp mức độ linh hoạt cao hơn bằng cách không giới hạn về họ máy, kích thước máy, vùng khả dụng hay khu vực địa lý. Với hình thức này, khách hàng có thể linh hoạt chuyển đổi khối lượng công việc giữa các loại máy như từ P4d sang P5en hoặc giữa các vùng khác nhau mà vẫn duy trì được mức giá ưu đãi.

Để tăng khả năng tiếp cận với mức giá thấp hơn, AWS đã triển khai việc mở rộng dung lượng theo hình thức On-Demand ở quy mô lớn tại nhiều khu vực trên thế giới. Cụ thể, phiên bản P4d đã được triển khai tại các vùng châu Á Thái Bình Dương như Seoul và Sydney, Canada và châu Âu như London. Phiên bản P4de hiện có mặt tại vùng miền Đông Hoa Kỳ. Các phiên bản P5 đã sẵn sàng tại các vùng châu Á như Mumbai, Tokyo và Jakarta, cũng như tại khu vực Nam Mỹ, trong khi P5en có mặt tại Mumbai, Tokyo và Jakarta.

Đặc biệt, kể từ ngày 15 tháng 5 năm 2025, AWS đã bắt đầu cung cấp phiên bản EC2 P6-B200 thông qua Savings Plans. Đây là dòng máy mới được trang bị GPU NVIDIA Blackwell, tối ưu cho các khối lượng công việc yêu cầu khả năng tính toán cao, đặc biệt là các tác vụ huấn luyện và suy luận AI phân tán quy mô lớn. Trước đó, dòng máy này chỉ có thể truy cập thông qua EC2 Capacity Blocks for ML.

Những cập nhật này thể hiện cam kết lâu dài của AWS trong việc giảm chi phí và mở rộng khả năng tiếp cận với công nghệ GPU tiên tiến cho mọi khách hàng, đồng thời góp phần thúc đẩy đổi mới sáng tạo và khả năng triển khai các giải pháp AI quy mô lớn trên nền tảng Cloud.