Ai cũng biết Netflix chi rất nhiều tiền cho AWS. Nhưng có một quyết định kiến trúc tài tình đã giúp họ cắt giảm hàng triệu đô la chi phí cloud mỗi tháng mà ít người nhận ra. Trong khi cộng đồng công nghệ thường tập trung vào kiến trúc microservices hay Chaos Engineering nổi tiếng của Netflix, họ đã bỏ qua câu chuyện tối ưu chi phí thực sự. Bí quyết này không nằm ở reserved instances, auto-scaling, hay bất kỳ mẹo tiết kiệm chi phí cloud thông thường nào.

Nó liên quan đến một lựa chọn chiến lược từ năm 2012, một quyết định đã thay đổi hoàn toàn cách Netflix tiếp cận việc phân phối nội dung. Lựa chọn này thành công đến mức hiện nay nó xử lý toàn bộ lưu lượng video của họ và đã giúp các đối tác ISP tiết kiệm hơn 1,25 tỷ đô la.
Vấn Đề Mà Nhiều Người Có Thể Bỏ Qua
Hãy bắt đầu với một con số đáng kinh ngạc: Netflix chiếm tới 14,9% tổng lưu lượng truy cập internet downstream trên toàn thế giới. Con số này lớn hơn cả YouTube, lớn hơn Amazon Prime Video, và lớn hơn bất kỳ dịch vụ internet nào khác.
Vào năm 2019, Netflix tiết lộ họ đang chi 9,6 triệu đô la/tháng cho AWS. Với tốc độ tăng trưởng chóng mặt, con số đó bây giờ có lẽ còn cao hơn nhiều. Nhưng điều thú vị là, trong khi họ phục vụ thêm hàng tỷ giờ nội dung, chi phí/1 gigabyte của họ lại liên tục giảm.
Hầu hết các công ty ở quy mô này sẽ đầu tư vào các CDN truyền thống như Fastly, Akamai, hay CloudFront. Họ sẽ mua thêm các edge location, tối ưu cache hit ratio, và hy vọng mọi thứ hoạt động tốt.
Netflix đã làm điều ngược lại. Họ loại bỏ hoàn toàn người trung gian.
Quyết Định Kiến Trúc Thay Đổi Cuộc Chơi
Vào năm 2012, Netflix đã quyết định xây dựng một CDN toàn cầu của riêng mình từ đầu đó là một ý tưởng có vẻ điên rồ vào thời điểm đó. Nhưng đây không phải là một CDN thông thường. Nó là một CDN được thiết kế đặc biệt với một mục tiêu duy nhất: phân phối nội dung video của Netflix một cách hiệu quả và tiết kiệm nhất. Họ gọi nó là Open Connect.
Trong khi mọi người đang tìm cách tinh chỉnh kiến trúc hiện có, Netflix đã đặt một câu hỏi khác: “Sẽ ra sao nếu chúng ta không phải trả tiền cho các nhà cung cấp CDN?”
Cách Open Connect Hoạt Động
Đây chính là điểm cốt lõi. Thay vì xây dựng các trung tâm dữ liệu khổng lồ và hy vọng nội dung được cache ở gần người dùng, Netflix đã di chuyển server của họ đến thẳng chỗ người dùng. Họ đã đưa ra một lời đề nghị hấp dẫn cho các Nhà cung cấp dịch vụ Internet (ISP) trên toàn thế giới: “Hãy để chúng tôi đặt server của mình trong trung tâm dữ liệu của các bạn. Hoàn toàn miễn phí. Chúng tôi cung cấp phần cứng và nạp sẵn nội dung phổ biến nhất cho khách hàng của bạn, còn bạn chỉ cần cung cấp không gian và điện năng.”
Những server này, được gọi là Open Connect Appliances (OCAs), về cơ bản là các kho chứa nội dung riêng của Netflix, được đặt ngay bên trong mạng lưới của các ISP. Khi một người dùng ở Mumbai muốn xem một chương trình, yêu cầu của họ sẽ được đáp ứng bởi một OCA đặt ngay trong tòa nhà của ISP, thay vì phải đi nửa vòng trái đất đến một trung tâm dữ liệu của AWS.
Kết quả là 95% lưu lượng truy cập toàn cầu của Netflix được truyền tải qua các kết nối trực tiếp từ Open Connect đến các ISP dân dụng. Không còn phí CDN đắt đỏ. Không có chi phí trung gian. Không phải chia sẻ băng thông với lưu lượng truy cập của các công ty khác.
Những Con Số Ấn Tượng
Kể từ khi ra mắt Open Connect vào năm 2012, Netflix đã:
- Chi 1 tỷ đô la để xây dựng và phân phối hơn 8.000 Open Connect Appliances.
- Giúp các ISP tiết kiệm 1,25 tỷ đô la transit costs.
- Xử lý toàn bộ lưu lượng video của mình qua hạ tầng riêng, loại bỏ phí CDN cho 95% lưu lượng.
Tuy nhiên, thực sự không chỉ nằm ở việc tiết kiệm chi phí, mà còn ở những tác động chiến lược.
Tại Sao Chiến Lược Này Lại Thiên Tài Đến Vậy?
-
Kiểm soát vận mệnh của chính mình Các CDN truyền thống là hạ tầng chia sẻ. Khi lưu lượng Black Friday của mọi người cùng đổ về một lúc, bạn sẽ phải tranh giành tài nguyên. Netflix không gặp vấn đề này vì họ sở hữu toàn bộ chuỗi phân phối của mình.
-
Biến chi phí thành quan hệ đối tác Thay vì trả tiền cho các nhà cung cấp CDN, Netflix đã biến việc phân phối nội dung thành các mối quan hệ đối tác cùng có lợi. Netflix có được hosting free, còn các ISP có được tốc độ phân phối nội dung nhanh hơn cho người dùng, giúp giảm các cuộc gọi hỗ trợ và tăng sự hài lòng của khách hàng.
-
Tối ưu cho trường hợp sử dụng cụ thể Các CDN thông thường hỗ trợ nhiều loại nội dung: trang web, hình ảnh, API, và video. CDN của Netflix chỉ được thiết kế cho một mục đích duy nhất: streaming video chất lượng cao. Sự chuyên môn hóa này cho phép các tối ưu hóa mà các CDN thông thường không thể thực hiện được.
-
Giảm độ trễ xuống gần như bằng không Việc đặt server bên trong mạng lưới của ISP giúp giảm khoảng cách vật lý giữa người dùng và nội dung. Điều này dẫn đến thời gian buffering ngắn hơn, thời gian khởi động nhanh hơn, và chất lượng stream cao hơn tất cả trong khi vẫn tiết kiệm chi phí.
Kiến Trúc Kỹ Thuật Đằng Sau Open Connect
Open Connect không chỉ đơn giản là việc đặt các server một cách ngẫu nhiên. Nó là một hệ thống tinh vi bao gồm:
- Caching thông minh: Các OCA không lưu trữ tất cả nội dung. Dựa trên các dự đoán từ machine learning, chúng sẽ pre-cache những nội dung có khả năng sẽ phổ biến trong khu vực của mình vào các giờ thấp điểm.
- Routing động: Hệ thống tự động định tuyến người dùng đến OCA tốt nhất dựa trên: vị trí địa lý, tải hiện tại của server, điều kiện mạng, và nội dung có sẵn.
- Failure Resilience: Nếu một OCA gặp sự cố, lưu lượng truy cập sẽ được chuyển đổi mượt mà sang các thiết bị lân cận khác hoặc quay trở lại AWS nếu cần.
- Adaptive Streaming: Nội dung được lưu trữ ở nhiều mức chất lượng khác nhau, cho phép hệ thống cung cấp chất lượng tối ưu nhất tùy thuộc vào tình trạng mạng.
Tại Sao Các Công Ty Khác Không Sao Chép Mô Hình Này?
Nếu cách tiếp cận này thành công như vậy, tại sao không phải ai cũng làm theo? Câu trả lời cho thấy chiến lược của Netflix xuất sắc đến mức nào:
- Đòi hỏi quy mô khổng lồ: Bạn phải đủ lớn để các ISP muốn hợp tác với bạn.
- Đòi hỏi đầu tư ban đầu lớn: 1 tỷ đô la cho hạ tầng không phải là con số nhỏ.
- Đòi hỏi tầm nhìn dài hạn: Thời gian hoàn vốn cho khoản đầu tư này được tính bằng năm, không phải bằng quý.
- Đòi hỏi chuyên môn kỹ thuật cao: Xây dựng và duy trì một CDN toàn cầu đòi hỏi kiến thức chuyên sâu.
Bài Học Rút Ra Cho Mọi Quy Mô
Mặc dù hầu hết các công ty không thể sao chép chính xác mô hình Open Connect, nhưng các nguyên tắc cơ bản có thể được áp dụng ở bất kỳ quy mô nào:
- Thách thức các giả định cơ bản: Netflix đã đặt câu hỏi liệu việc sử dụng CDN của bên thứ ba có thực sự cần thiết không. Bạn đang có những giả định nào về kiến trúc của mình mà có thể không cần thiết?
- Biến chi phí thành hợp tác: Thay vì chỉ trả tiền cho nhà cung cấp, hãy tìm cách tạo ra các mối quan hệ đối tác cùng có lợi.
- Tối ưu cho trường hợp sử dụng của bạn: Các giải pháp chung chung thì hiệu quả, nhưng các giải pháp tùy chỉnh cho nhu cầu cụ thể của bạn thường mang lại hiệu suất vượt trội.
- Suy nghĩ dài hạn: Khoản đầu tư 1 tỷ đô la của Netflix vào năm 2012 có vẻ tốn kém. Hiện tại, nó là một trong những lợi thế cạnh tranh lớn nhất của họ.
Kết Luận
Mọi người thường nói về kiến trúc microservices và chaos engineering của Netflix. Nhưng việc xây dựng Open Connect có thể mới là quyết định kiến trúc quan trọng nhất và ít được chú ý nhất của họ. Bằng cách loại bỏ người trung gian, Netflix không chỉ tiết kiệm tiền. Họ đã xây dựng một lợi thế cạnh tranh bền vững và ngày càng mạnh mẽ hơn khi họ phát triển.
Bài học ở đây không phải là mọi công ty nên xây dựng CDN của riêng mình. Bài học là những cơ hội tối ưu hóa lớn nhất thường đến từ việc thách thức những giả định cơ bản nhất về cách mọi thứ hoạt động.
Rất có thể họ sẽ không chỉ mua các instance nhỏ hơn hay điều chỉnh cài đặt auto-scaling. Họ sẽ đặt câu hỏi liệu họ có thực sự cần sử dụng dịch vụ đó ngay từ đầu hay không. Đôi khi, tối ưu hóa tốt nhất chính là loại bỏ.