Viettel đưa GPU NVIDIA vào trung tâm dữ liệu AI

Viettel đang đặt thêm một lớp nền tảng quan trọng cho hạ tầng số tại Việt Nam khi kết hợp trung tâm dữ liệu quy mô lớn tại Hòa Lạc 2 với các cụm máy chủ GPU NVIDIA H200 và hệ thống siêu máy tính DGX B200. Với hướng đầu tư này, câu chuyện không chỉ nằm ở năng lực xử lý AI, mà còn ở kiến trúc hạ tầng, khả năng vận hành trung tâm dữ liệu mật độ cao và bài toán tự chủ năng lực tính toán trong nước.

6341768c-fe0a-4bac-a61f-12104c27dbac

Trung tâm Dữ liệu Hòa Lạc 2 của Viettel là một trong những hạ tầng dữ liệu lớn được xây dựng tại khu công nghệ cao Hòa Lạc. Theo thông tin Viettel từng công bố, cơ sở này có quy mô khoảng 2.400 rack, hơn 60.000 máy chủ, diện tích sàn 21.000 m² và công suất điện 30 MW. Đây là những thông số cho thấy Hòa Lạc 2 được thiết kế để phục vụ các workload có yêu cầu cao về tài nguyên tính toán, lưu trữ và mạng, bao gồm điện toán đám mây, xử lý dữ liệu lớn và trí tuệ nhân tạo.

Một điểm đáng chú ý là Hòa Lạc 2 đã được Uptime Institute trao chứng chỉ Tier III Certification of Design Documents. Về bản chất, đây là chứng chỉ xác nhận thiết kế trung tâm dữ liệu đáp ứng các tiêu chí Tier III, bao gồm khả năng bảo trì đồng thời các thành phần hạ tầng trọng yếu mà không làm gián đoạn dịch vụ. Cách diễn đạt chính xác ở đây là đạt chứng chỉ Tier III về thiết kế, thay vì hiểu rộng là toàn bộ trung tâm dữ liệu đã hoàn tất mọi cấp chứng nhận về xây dựng hoặc vận hành.

Ở tầng tính toán, Viettel cho biết hạ tầng AI tại Hòa Lạc 2 tích hợp hơn 100 cụm máy chủ sử dụng GPU NVIDIA H200. H200 là dòng GPU trung tâm dữ liệu được NVIDIA phát triển cho các bài toán AI tạo sinh và tính toán hiệu năng cao, với trọng tâm là dung lượng bộ nhớ lớn và băng thông bộ nhớ cao. Đây là yếu tố đặc biệt quan trọng với các mô hình ngôn ngữ lớn, mô hình đa phương thức và các pipeline huấn luyện/suy luận cần xử lý lượng dữ liệu lớn trong thời gian ngắn.

Bên cạnh H200, Viettel cũng đã đưa vào vận hành hệ thống siêu máy tính sử dụng nền tảng NVIDIA DGX B200. Theo các công bố báo chí, hệ thống này có hiệu năng lên tới 1,5 ExaFLOPs FP8, tương đương khoảng 1.500 triệu tỷ phép tính mỗi giây. Tuy nhiên, cần diễn giải thận trọng: con số này nên được hiểu là năng lực của hệ thống B200 mà Viettel triển khai, không phải thông số của một máy chủ DGX B200 đơn lẻ. Theo NVIDIA, một DGX B200 đơn lẻ được trang bị 8 GPU Blackwell và có hiệu năng FP8 Tensor Core ở mức 72 PFLOPS.

Từ góc nhìn hạ tầng, việc đưa các cụm GPU H200 và DGX B200 vào trung tâm dữ liệu không đơn thuần là bổ sung thêm máy chủ mạnh. Các hệ thống GPU mật độ cao đặt ra yêu cầu rất lớn về thiết kế điện, làm mát, kết nối mạng nội bộ, phân bổ tài nguyên, giám sát vận hành và khả năng mở rộng theo cụm. Với AI workload, hiệu năng không chỉ phụ thuộc vào GPU, mà còn phụ thuộc vào toàn bộ stack hạ tầng: từ interconnect giữa các GPU, mạng giữa các node, hệ thống lưu trữ tốc độ cao, cho đến nền tảng điều phối tài nguyên và phần mềm phục vụ huấn luyện mô hình.

Điều này khiến Hòa Lạc 2 trở thành một phần quan trọng trong chiến lược xây dựng năng lực AI nội địa. Thay vì phụ thuộc hoàn toàn vào tài nguyên tính toán ở nước ngoài, việc triển khai các cụm GPU lớn trong nước giúp các tổ chức có thêm lựa chọn về độ trễ, chủ quyền dữ liệu, kiểm soát vận hành và tuân thủ yêu cầu bảo mật. Đây là các yếu tố ngày càng quan trọng khi AI được đưa vào các hệ thống doanh nghiệp, viễn thông, tài chính, chính phủ số và các dịch vụ số quy mô lớn.

Một điểm khác cũng đáng chú ý là Viettel nhấn mạnh vai trò của đội ngũ kỹ sư trong nước trong quá trình thiết kế và vận hành hạ tầng. Với một trung tâm dữ liệu quy mô hàng nghìn rack, năng lực tự chủ không chỉ nằm ở việc sở hữu phần cứng, mà còn ở khả năng thiết kế kiến trúc, tích hợp hệ thống, tối ưu vận hành và duy trì độ sẵn sàng trong suốt vòng đời khai thác.

Nhìn tổng thể, sự kết hợp giữa Data Center Hòa Lạc 2 và các nền tảng GPU NVIDIA thế hệ mới cho thấy Viettel đang dịch chuyển từ vai trò nhà vận hành hạ tầng viễn thông truyền thống sang nhà cung cấp hạ tầng số quy mô lớn cho AI và cloud. Đây là bước đi có ý nghĩa trong bối cảnh nhu cầu tính toán AI tại Việt Nam tăng nhanh, trong khi năng lực trung tâm dữ liệu, GPU cluster và nền tảng vận hành hạ tầng vẫn là những thành phần then chốt quyết định khả năng cạnh tranh công nghệ trong dài hạn.

Chia sẻ bài viết:
Theo dõi
Thông báo của
0 Góp ý
Được bỏ phiếu nhiều nhất
Mới nhất Cũ nhất