❤️ AZDIGI chính thức cập nhật hệ thống blog mới hoàn chỉnh. Tuy nhiên có thể một số bài viết bị sai lệch hình ảnh, hãy ấn nút Báo cáo bài viết ở cuối bài để AZDIGI cập nhật trong thời gian nhanh nhất. Chân thành cám ơn.

RAID (Redundant Array of Independent Disks) là công nghệ kết hợp nhiều ổ cứng vật lý thành một hệ thống lưu trữ duy nhất. Mục tiêu là tăng tốc độ đọc/ghi, bảo vệ dữ liệu khi ổ hỏng, hoặc cả hai.

Khái niệm RAID được đề xuất lần đầu năm 1988 bởi nhóm nghiên cứu tại Đại học California, Berkeley. Ban đầu, chữ “I” trong RAID là “Inexpensive” (giá rẻ), ý tưởng là dùng nhiều ổ nhỏ giá rẻ thay cho một ổ lớn đắt tiền. Sau này, thuật ngữ đổi thành “Independent” cho đúng bản chất hơn.

Đến nay, RAID vẫn là thành phần tiêu chuẩn trong hầu hết server, hệ thống lưu trữ và dịch vụ hosting chuyên nghiệp.

Tại sao cần RAID?

Ổ cứng là linh kiện cơ học (HDD) hoặc điện tử (SSD), và đều có tuổi thọ giới hạn. Trong môi trường server chạy 24/7, nguy cơ hỏng ổ là chuyện sớm muộn, không phải chuyện “nếu” mà là “khi nào”.

RAID giải quyết hai vấn đề chính:

  • Bảo vệ dữ liệu (redundancy): Khi một ổ hỏng, dữ liệu vẫn còn nguyên trên các ổ khác. Server tiếp tục hoạt động bình thường trong khi thay ổ mới.
  • Tăng hiệu năng (performance): Dữ liệu được chia ra nhiều ổ, đọc/ghi song song giúp tốc độ nhanh hơn so với dùng một ổ đơn lẻ.

Tùy cấp RAID, bạn có thể chọn ưu tiên tốc độ, ưu tiên an toàn, hoặc cân bằng cả hai. Phần tiếp theo sẽ đi vào từng cấp cụ thể.

Các cấp RAID phổ biến

Các cấp RAID phổ biến

RAID 0 (Striping)

RAID 0 chia dữ liệu thành các block nhỏ rồi ghi xen kẽ lên nhiều ổ. Ví dụ với 2 ổ: block 1 ghi vào ổ A, block 2 ghi vào ổ B, block 3 lại vào ổ A, cứ thế luân phiên.

Ưu điểm là tốc độ đọc/ghi gần như tăng tuyến tính theo số ổ. 2 ổ cho tốc độ gần gấp đôi, 4 ổ cho gần gấp 4. Toàn bộ dung lượng ổ đều được sử dụng.

Nhược điểm: không có bất kỳ cơ chế bảo vệ nào. Chỉ cần một ổ hỏng là mất toàn bộ dữ liệu. RAID 0 phù hợp cho các tác vụ cần tốc độ cao mà dữ liệu có thể khôi phục được, như render video hay cache tạm.

  • Số ổ tối thiểu: 2
  • Dung lượng sử dụng: 100%
  • Chịu lỗi: không

RAID 1 (Mirroring)

RAID 1 ghi dữ liệu giống hệt nhau lên hai ổ (hoặc nhiều hơn). Nôm na là tạo bản sao y chang theo thời gian thực.

Khi một ổ hỏng, ổ còn lại vẫn có đầy đủ dữ liệu. Tốc độ đọc có thể tăng vì hệ thống đọc từ cả hai ổ song song. Tốc độ ghi thì không cải thiện vì phải ghi vào cả hai ổ cùng lúc.

Nhược điểm rõ nhất là tốn dung lượng. Dùng 2 ổ 1TB thì chỉ có 1TB dùng được. Chi phí lưu trữ tăng gấp đôi.

  • Số ổ tối thiểu: 2
  • Dung lượng sử dụng: 50%
  • Chịu lỗi: 1 ổ

RAID 5 (Striping + Parity)

RAID 5 kết hợp striping với parity (dữ liệu kiểm tra). Dữ liệu và parity được phân bổ đều trên tất cả các ổ. Khi một ổ hỏng, hệ thống dùng parity để tính ngược lại dữ liệu bị mất.

Đây là cấp RAID cân bằng tốt giữa tốc độ, dung lượng và an toàn. Với 4 ổ 1TB, bạn dùng được 3TB, mất 1TB cho parity. Tốc độ đọc tốt, tốc độ ghi chậm hơn RAID 0 do phải tính parity.

Hạn chế: chỉ chịu được 1 ổ hỏng. Nếu đang rebuild mà thêm ổ thứ hai lỗi thì mất dữ liệu. Với ổ dung lượng lớn (4TB trở lên), thời gian rebuild kéo dài hàng chục giờ, rủi ro này không nhỏ.

  • Số ổ tối thiểu: 3
  • Dung lượng sử dụng: (n-1)/n
  • Chịu lỗi: 1 ổ

RAID 6 (Double Parity)

RAID 6 giống RAID 5 nhưng dùng hai block parity thay vì một. Nhờ vậy, RAID 6 chịu được đồng thời 2 ổ hỏng mà không mất dữ liệu.

Cái hay là bạn yên tâm hơn khi rebuild. Một ổ hỏng, hệ thống vẫn an toàn ngay cả khi thêm ổ thứ hai gặp vấn đề trong quá trình rebuild.

Đổi lại, tốc độ ghi chậm hơn RAID 5 (tính toán parity nhiều hơn) và mất dung lượng 2 ổ cho parity. Với 6 ổ 1TB, dùng được 4TB.

  • Số ổ tối thiểu: 4
  • Dung lượng sử dụng: (n-2)/n
  • Chịu lỗi: 2 ổ

RAID 10 (RAID 1+0)

RAID 10 kết hợp mirroring (RAID 1) và striping (RAID 0). Dữ liệu được mirror trước, rồi stripe trên các cặp mirror.

Ví dụ với 4 ổ: ổ A và B là một cặp mirror, ổ C và D là cặp mirror thứ hai. Dữ liệu stripe xen kẽ giữa hai cặp. Kết quả là vừa có tốc độ cao của striping, vừa có an toàn của mirroring.

RAID 10 chịu được ít nhất 1 ổ hỏng, và có thể chịu đến 2 ổ nếu hai ổ hỏng nằm ở hai cặp mirror khác nhau. Tốc độ đọc/ghi đều tốt. Thời gian rebuild nhanh vì chỉ cần copy lại từ ổ mirror còn sống.

Nhược điểm: mất 50% dung lượng cho mirror, và cần tối thiểu 4 ổ. Dù vậy, RAID 10 là lựa chọn phổ biến nhất cho database server, web server và các hệ thống cần cả hiệu năng lẫn độ tin cậy.

  • Số ổ tối thiểu: 4
  • Dung lượng sử dụng: 50%
  • Chịu lỗi: ít nhất 1 ổ (tối đa n/2 nếu mỗi cặp chỉ hỏng 1)

Bảng so sánh các cấp RAID

Bảng so sánh các loại RAID
Tiêu chí RAID 0 RAID 1 RAID 5 RAID 6 RAID 10
Số ổ tối thiểu 2 2 3 4 4
Dung lượng sử dụng 100% 50% (n-1)/n (n-2)/n 50%
Chịu lỗi ổ 0 1 1 2 1-n/2
Tốc độ đọc Rất cao Cao Cao Cao Rất cao
Tốc độ ghi Rất cao Trung bình Trung bình Thấp hơn RAID 5 Cao
Thời gian rebuild Không Nhanh Chậm Rất chậm Nhanh
Ứng dụng phù hợp Cache, render Dữ liệu quan trọng nhỏ File server, NAS Lưu trữ lớn, archive Database, web server

Nếu bạn muốn tìm hiểu sâu hơn, xem so sánh chi tiết từng cấp RAID hoặc bài phân tích RAID 10 vs RAID 5.

Hardware RAID vs Software RAID

Có hai cách triển khai RAID: bằng phần cứng (hardware RAID) và bằng phần mềm (software RAID).

Hardware RAID dùng card RAID controller riêng, có chip xử lý và bộ nhớ cache riêng. Card này quản lý toàn bộ hoạt động RAID mà không cần CPU và RAM của server. Các dòng phổ biến là LSI MegaRAID, Dell PERC, HP Smart Array.

Ưu điểm của hardware RAID là hiệu năng ổn định, hỗ trợ battery backup (BBU) để bảo vệ cache khi mất điện, và hoạt động độc lập với hệ điều hành. Nhược điểm là chi phí cao và phụ thuộc vào model card (nếu card hỏng, cần card cùng loại để đọc lại dữ liệu).

Software RAID dùng CPU và RAM của server để quản lý RAID. Linux có mdadm, Windows có Storage Spaces, macOS có Disk Utility. Không cần mua thêm phần cứng.

Software RAID linh hoạt hơn, dễ mở rộng, chi phí thấp. Tuy nhiên, nó dùng chung tài nguyên CPU/RAM với hệ thống. Với SSD/NVMe hiện nay, software RAID hoạt động khá tốt vì CPU hiện đại thừa sức xử lý parity.

Trong thực tế, server doanh nghiệp thường dùng hardware RAID. VPS và cloud thường dùng software RAID hoặc các giải pháp lưu trữ phân tán (distributed storage).

RAID có thay thế backup không?

Không. Đây là hiểu lầm phổ biến.

RAID bảo vệ khỏi sự cố phần cứng (ổ hỏng). Nhưng RAID không bảo vệ khỏi:

  • Xóa nhầm file, cả hệ thống xóa đồng thời trên mọi ổ
  • Ransomware mã hóa dữ liệu, tất cả các ổ đều bị mã hóa
  • Lỗi phần mềm ghi đè dữ liệu sai
  • Hỏng controller RAID khiến toàn bộ array không đọc được
  • Thiên tai, cháy nổ phá hủy cả server

RAID giữ cho server chạy liên tục khi ổ hỏng. Backup giữ cho dữ liệu có thể khôi phục khi mọi thứ khác đều thất bại. Hai thứ này bổ sung cho nhau, không thay thế nhau.

Quy tắc vẫn là 3-2-1: ba bản sao, hai loại media khác nhau, một bản offsite.

Ứng dụng RAID trong hosting và server

Trong ngành hosting, RAID là tiêu chuẩn bắt buộc. Cụ thể:

Web server và hosting: Phần lớn dùng RAID 10 hoặc RAID 5. Với web server phục vụ nhiều website, RAID 10 cho tốc độ đọc/ghi tốt nhất, đặc biệt với các tác vụ I/O ngẫu nhiên như database query.

VPS và cloud: Hạ tầng VPS thường chạy trên RAID 10 với ổ NVMe để đảm bảo tốc độ cho nhiều VPS cùng lúc. Tại AZDIGI, hệ thống VPS NVMe sử dụng công nghệ NVMe U.2 RAID-10 cho tốc độ đọc/ghi vượt trội so với SSD SATA thông thường.

Database server: MySQL, PostgreSQL, MongoDB đều có pattern đọc/ghi ngẫu nhiên rất nhiều. RAID 10 là lựa chọn phổ biến nhất cho database production vì tốc độ ghi tốt và rebuild nhanh.

Backup và lưu trữ: Các hệ thống backup, NAS thường dùng RAID 5 hoặc RAID 6. Dung lượng sử dụng được nhiều hơn, tốc độ ghi không quan trọng bằng vì backup thường chạy theo lịch.

Câu hỏi thường gặp

RAID có thay thế backup không?

Không. RAID chỉ bảo vệ khi ổ cứng hỏng. Nếu bị xóa nhầm, ransomware, hoặc lỗi phần mềm thì RAID không giúp được. Luôn cần backup song song với RAID.

Server cần tối thiểu bao nhiêu ổ cứng cho RAID?

Tối thiểu 2 ổ cho RAID 0 hoặc RAID 1. RAID 5 cần 3 ổ, RAID 6 và RAID 10 cần 4 ổ. Số ổ cụ thể tùy cấp RAID bạn chọn.

RAID nào phổ biến nhất cho web server?

RAID 10 là lựa chọn phổ biến nhất cho web server và database server. Lý do là RAID 10 cho tốc độ đọc/ghi đều tốt, rebuild nhanh, và chịu lỗi ổ tốt. RAID 5 cũng được dùng khi cần tối ưu dung lượng hơn tốc độ.

Hardware RAID và Software RAID khác nhau thế nào?

Hardware RAID dùng card controller riêng có chip xử lý và bộ nhớ, không chia sẻ tài nguyên với server. Software RAID dùng CPU và RAM của server để quản lý. Hardware RAID ổn định hơn nhưng đắt. Software RAID linh hoạt, rẻ, và đủ tốt với SSD/NVMe hiện nay.


Nếu bạn đang tìm VPS hoạt động trên nền tảng RAID 10 NVMe với hiệu năng cao, tham khảo VPS chất lượng cao tại AZDIGI.

Chia sẻ:
Bài viết đã được kiểm duyệt bởi AZDIGI Team

Về tác giả

Trần Thắng

Trần Thắng

Chuyên gia tại AZDIGI với nhiều năm kinh nghiệm trong lĩnh vực web hosting và quản trị hệ thống.

Hơn 10 năm phục vụ 80.000+ khách hàng

Bắt đầu dự án web của bạn với AZDIGI