DevOps Troubleshooting Cheat Sheet

Cheat sheet này cung cấp các lệnh và công cụ để xử lý sự cố hệ thống trong môi trường DevOps, tập trung vào tải hệ thống, quản lý đĩa, và mạng.

Tải hệ thống (System Load)

Lệnh Mô tả Ghi chú
uptime Hiển thị thời gian hoạt động và trung bình tải CPU trong 5, 10, 15 phút Nhanh, không cần cài thêm
top -b -n 1 Chạy top ở chế độ batch, cập nhật 1 lần rồi thoát Dùng để xuất dữ liệu
systat Cài gói sysstat và bật trong /etc/default/sysstat (ENABLED="true") Cung cấp công cụ như sar, iostat
iotop Hiển thị mức sử dụng đĩa theo tiến trình (giống top) Cần quyền root
iostat Hiển thị thống kê I/O cho các thiết bị khối Phần sysstat
sar Xem nhật ký sysstat trong ngày Mặc định lưu tại /var/log/sysstat
sar -r Xem thống kê RAM Phân tích bộ nhớ
sar -b Xem thống kê I/O Đánh giá hiệu suất đĩa
sar -s 00:00:00 -e 00:00:00 Xem thống kê trong khoảng thời gian (bắt đầu – kết thúc) Định dạng 24h
sar -f /var/log/sysstat/sa* Xem dữ liệu từ file nhật ký cụ thể Dùng để phân tích lịch sử

Quản lý đĩa (Disk Management)

Lệnh Mô tả Ghi chú
e2label /dev/sdX /newlabel Thay đổi nhãn của hệ thống tập tin ext* Thay X bằng ký tự ổ đĩa (ví dụ: sda1)
blkid Liệt kê thuộc tính thiết bị khối (UUID, loại FS) Hữu ích khi cấu hình /etc/fstab
/etc/fstab File cấu hình hệ thống tập tin gắn kết lúc khởi động Sao lưu trước khi chỉnh sửa
du -ckx | sort -n Hiển thị dung lượng đĩa: (c) tổng, (k) kích thước 1k, (x) một hệ thống tập tin, sắp xếp theo số Giúp tìm thư mục lớn
/etc/logrotate.conf Chỉnh sửa cài đặt xoay vòng nhật ký (log rotation) Quản lý dung lượng log
df -i Báo cáo dung lượng đĩa, hiển thị số inode Kiểm tra hết inode
fsck -y -C /dev/sdX Kiểm tra hệ thống tập tin: (y) tự động sửa, (C) thanh tiến trình Chạy khi unmounted
mke2fs -n /dev/sdX Liệt kê superblock trên hệ thống tập tin Không ghi, chỉ xem
fsck -b [superblock] -y -C /dev/sdX Sửa hệ thống tập tin bằng superblock dự phòng Dùng khi superblock chính hỏng

Xử lý sự cố mạng (Networking Troubleshooting)

Lệnh Mô tả Ghi chú
ifconfig Thu thập thông tin về adapter mạng (IP, MAC, v.v.) Thay bằng ip addr trên hệ thống mới
ethtool eth0 Phân tích kết nối Ethernet (tốc độ, duplex) Thay eth0 bằng tên giao diện
sudo route -n Kiểm tra bảng định tuyến, (n) không phân giải DNS Nhanh hơn route thông thường
sudo service networking restart Khởi động lại dịch vụ mạng Có thể lỗi trên systemd, dùng systemctl
nslookup [domain] Truy vấn DNS để lấy IP từ URL hoặc ngược lại Ví dụ: nslookup google.com
traceroute [host] Theo dõi đường đi gói tin đến host Cài nếu chưa có (apt install traceroute)
ping [host] -c [n] Gửi n gói ICMP để kiểm tra kết nối Ví dụ: ping google.com -c 10
netstat -tulnp Liệt kê cổng đang lắng nghe và tiến trình Cần cài net-tools

Bổ sung: Xử lý sự cố hiệu suất (Performance Troubleshooting)

Lệnh Mô tả Ghi chú
vmstat 1 Hiển thị thống kê hệ thống (CPU, RAM, I/O) mỗi giây Phần sysstat
free -h Hiển thị bộ nhớ trống và đã dùng (đơn vị dễ đọc) Kiểm tra RAM nhanh
htop Giao diện top cải tiến, dễ theo dõi tiến trình Cài nếu chưa có
dmesg | tail Xem các thông báo kernel gần nhất Phát hiện lỗi phần cứng

Mẹo xử lý sự cố

  • Kiểm tra log: Xem /var/log/syslog hoặc /var/log/messages để tìm nguyên nhân.
  • Tăng chi tiết: Thêm -v vào lệnh (ví dụ: fsck -v) để xem thêm thông tin.
  • Kiểm tra tài nguyên: Dùng iotoptop cùng lúc để phân tích CPU và I/O.
  • Sao lưu: Luôn sao lưu /etc/fstab hoặc file cấu hình trước khi sửa.
Chia sẻ bài viết:
Theo dõi
Thông báo của
0 Góp ý
Được bỏ phiếu nhiều nhất
Mới nhất Cũ nhất
Phản hồi nội tuyến
Xem tất cả bình luận