Danh sách bài viết trong series Sử dụng Docker từ cơ bản đến nâng cao
- Bài 1. Cơ Bản Docker: Hiểu Container và Vai Trò trong DevOps
- Bài 2. Docker Image: cách xây Dựng và tối Ưu
- Bài 3. Docker Networking: Kết Nối Container Hiệu Quả
- Bài 4. Docker Volume: Quản Lý Dữ Liệu Hiệu Quả cho Container
- Bài 5. Docker Compose: Điều Phối Multi-Container Hiệu Quả
- Bài 6. Docker Swarm: Orchestration Cơ Bản để Scale Container
- Bài 7. Docker Security: Bảo Mật Container Hiệu Quả
- Bài 8. Docker CI/CD: Tích Hợp Container vào Pipeline DevOps
- Bài 9. Docker Monitoring: Theo Dõi và Logging Container Hiệu Quả
- Bài 10. Docker resources: Tối Ưu và Debug Container Hiệu Quả
- Bài 11. Docker và Microservices: Thiết Kế Ứng Dụng Phân Tán
- Bài 12. Docker Registry: Tự Host và Quản Lý Image Hiệu Quả
- Bài 13. Docker với Cloud: Tích Hợp Container trên AWS ECS và GCP Cloud Run
Sau khi làm quen với Docker từ cơ bản đến tích hợp CI/CD, giờ là lúc nâng tầm kỹ năng với những vấn đề thực tế hơn. Container chạy chậm, ăn hết RAM, hay chết mà không rõ lý do? Trong bài thứ mười – bài cuối của series – tôi sẽ dẫn bạn qua Docker Nâng Cao trong DevOps, từ tối ưu container với resource limit, cách debug container lỗi, đến thực hành xử lý vấn đề thường gặp. Đây là kinh nghiệm tôi rút ra từ thực tế, không chỉ là lý thuyết đâu nhé!
Tại Sao Cần Tối Ưu và Debug Nâng Cao?
Thách Thức trong DevOps
- Hiệu năng: Container ngốn tài nguyên, làm chậm pipeline.
- Lỗi phức tạp: Container dừng mà log không rõ nguyên nhân.
- Scale: Hệ thống lớn cần tối ưu để chạy mượt.
Ví dụ thực tế: Một team DevOps gặp container API crash liên tục dưới tải cao. Sau khi debug và giới hạn resource, họ giảm downtime từ 2 giờ xuống 0.
Mục Tiêu
- Chạy container hiệu quả, tiết kiệm tài nguyên.
- Tìm và fix lỗi nhanh trong production.
DevOps: Tối ưu và debug là “vũ khí” để giữ hệ thống ổn định.
Tối Ưu Container: Resource Limit và Healthcheck
Giới Hạn Tài Nguyên (Resource Limit)
Docker cho phép giới hạn CPU, RAM để container không “ăn” quá mức.
-
Ví dụ:
docker run -d --memory="512m" --cpus="0.5" -p 5000:5000 myapp
- RAM: 512MB, CPU: 0.5 core.
-
Update runtime:
docker update --memory="256m" <container-id>
DevOps: Giới hạn resource trong pipeline test để mô phỏng production.
Healthcheck: Kiểm Tra Sức Khỏe
- Thêm healthcheck vào Dockerfile:
HEALTHCHECK --interval=30s --timeout=3s CMD curl -f http://localhost:5000/ || exit 1
- Container tự báo “unhealthy” nếu lỗi.
Thực tế: Tôi từng dùng healthcheck để phát hiện API timeout sớm, thay vì đợi user báo.
Debug Container: Xử Lý Lỗi Thực Tế
Kiểm Tra Resource Usage
- Stats:
docker stats
- Xem CPU, RAM, I/O của tất cả container.
Ví dụ: Container Flask ăn 90% CPU → cần tối ưu code hoặc tăng limit.
Debug Bên Trong Container
-
Exec:
docker exec -it <container-id> bash
- Vào shell, kiểm tra process, file.
-
Top:
docker top <container-id>
- Xem process chạy trong container.
DevOps: Dùng exec
để debug pipeline test khi job fail.
Phân Tích Lỗi với Log và Exit Code
- Log:
docker logs <container-id>
- Exit code:
docker inspect <container-id> --format='{{.State.ExitCode}}'
- 0: OK, khác 0: lỗi.
Thực tế: Exit code 137 thường là OOM (out of memory) – tăng RAM hoặc tối ưu app.
Thực Hành: Tối Ưu và Debug Flask App
Chuẩn Bị
-
Dockerfile:
FROM python:3.9-slim WORKDIR /app COPY requirements.txt . RUN pip install -r requirements.txt COPY app.py . HEALTHCHECK --interval=10s --timeout=3s CMD curl -f http://localhost:5000/ || exit 1 CMD ["python", "app.py"]
-
app.py
:from flask import Flask import time app = Flask(__name__) @app.route('/') def hello(): time.sleep(0.5) # Giả lập tải nặng return "Hello Debug!" if __name__ == "__main__": app.run(host="0.0.0.0", port=5000)
requirements.txt
:flask==2.0.1
-
-
Build:
docker build -t myapp .
Chạy và Tối Ưu
- Chạy với limit:
docker run -d --memory="128m" --cpus="0.2" -p 5000:5000 --name flask-app myapp
- Test tải:
while true; do curl localhost:5000; sleep 0.1; done
- Kiểm tra:
docker stats flask-app
- Nếu CPU/RAM max → tăng limit hoặc tối ưu
time.sleep
.
- Nếu CPU/RAM max → tăng limit hoặc tối ưu
Debug Lỗi
- Giả lập lỗi (xóa
curl
trong healthcheck):docker stop flask-app docker run -d -p 5000:5000 --name flask-app myapp
- Kiểm tra:
docker inspect flask-app --format='{{.State.Health.Status}}'
- Thấy “unhealthy”.
- Xem log:
docker logs flask-app
Debug tip:
- Container chết: Check exit code, log, RAM usage.
- Healthcheck fail: Test command thủ công trong
exec
.
Ứng Dụng trong DevOps
Pipeline CI/CD
- Limit trong CI:
test: image: myapp script: - pytest variables: DOCKER_MEMORY: "256m" DOCKER_CPUS: "0.5"
- Kết quả: Test không làm crash runner.
Production
- Dùng healthcheck + Swarm (bài 6):
docker service create --name web --replicas 3 --healthcheck-interval=10s -p 5000:5000 myapp
- Auto restart container unhealthy.
Case study: Một team tối ưu container từ 1GB RAM xuống 256MB nhờ resource limit, tiết kiệm 30% chi phí cloud.
Kết Luận
Docker Nâng Cao trong DevOps là bước quan trọng để bạn làm chủ container – từ tối ưu container với resource limit, debug container lỗi, đến xử lý vấn đề thực tế. Thực hành với Flask cho thấy bạn có thể áp dụng ngay vào pipeline và production.