RAID là một công nghệ lưu trữ dữ liệu, liên quan đến ổ cứng, máy chủ và phần cứng máy tính. Bài viết này mình sẽ giúp bạn hiểu rõ hơn về định nghĩa phổ biến nhất của RAID, lý do RAID quan trọng, các loại của RAID và cách chọn cấu hình RAID chi tiết.
Các điểm chính
- Khái niệm RAID: Công nghệ kết hợp nhiều ổ đĩa để tăng tốc độ, an toàn dữ liệu hoặc cả hai.
- Lịch sử: Từ những năm 1970 với các công nghệ tiền thân, chính thức định nghĩa năm 1987-1988 với 5 cấp độ đầu tiên.
- Các loại RAID phổ biến: RAID 0, RAID 1, RAID 5, RAID 10, JBOB, các loại khác
- Tầm quan trọng của RAID cho server: Giúp đảm bảo tính liên tục của dịch vụ và bảo vệ dữ liệu khỏi nguy cơ mất mát khi một ổ cứng bị lỗi.
- Điều kiện để chạy RAID: Yêu cầu lựa chọn loại RAID phù hợp, phần cứng tương thích như bộ điều khiển và ổ cứng, cùng với việc cài đặt đúng cách qua BIOS.
- Giải đáp thắc mắc thường gặp khi sử dụng RAID.
RAID là gì?
RAID (Redundant Array of Independent Disks) là công nghệ kết hợp nhiều ổ đĩa cứng vật lý như HDD hoặc SSD thành một hệ thống ổ đĩa duy nhất. Mục đích chính của RAID là để tăng tốc độ đọc/ghi dữ liệu, tăng cường an toàn dữ liệu hoặc kết hợp cả hai yếu tố trên.

Lịch sử ra đời của RAID
Dưới đây là tóm tắt ngắn gọn về lịch sử hình thành và phát triển của công nghệ RAID:
- Thập niên 1970: Các công nghệ tiền thân của RAID đã được sử dụng. Ví dụ, kỹ thuật phản chiếu dữ liệu (mirroring), sau này được biết đến là RAID 1, đã được công ty Tandem Computers triển khai trong các hệ thống máy tính chịu lỗi của họ.
- 1977: Norman Ken Ouchi tại IBM đã nộp bằng sáng chế cho một công nghệ lưu trữ mà sau này được định danh là RAID 4.
- 1983: Công ty Digital Equipment Corp. (DEC) bắt đầu cung cấp các ổ đĩa sử dụng kỹ thuật phản chiếu, mà sau này trở thành nền tảng cho RAID 1.
- 1986: Một bằng sáng chế khác của IBM được nộp, mô tả công nghệ mà sau này được gọi là RAID 5.
- 1987: Thuật ngữ “RAID” (viết tắt của Redundant Arrays of Inexpensive Disks – Mảng đĩa dự phòng giá rẻ) được đặt ra bởi ba nhà nghiên cứu David Patterson, Garth Gibson và Randy Katz tại Đại học California, Berkeley.
- 1988: Patterson, Gibson và Katz công bố bài báo khoa học có tiêu đề “A Case for Redundant Arrays of Inexpensive Disks (RAID)” tại hội nghị SIGMOD. Bài báo này đã định nghĩa chính thức 5 cấp độ RAID đầu tiên (RAID 1 đến RAID 5) và chính thức hóa các khái niệm đã được sử dụng trước đó, tạo ra một thuật ngữ chung và thúc đẩy thị trường phát triển các sản phẩm mảng RAID.
- 1992: Hội đồng tư vấn phát triển RAID (RAID Advisory Board – RAB) được thành lập để đưa ra các định hướng và tiêu chuẩn cho công nghệ RAID. RAB đã phân loại các cấp độ RAID và các tiêu chuẩn phần cứng liên quan.
Các loại RAID phổ biến
Có nhiều cấp độ RAID, mỗi cấp độ có cách hoạt động và mục đích riêng. Dưới đây là những loại phổ biến nhất bạn nên biết.
RAID 0
Tập trung 100% vào tốc độ. Với RAID 0, dữ liệu được chia thành các khối nhỏ, sau đó các khối này được ghi xen kẽ (striping) lên lần lượt từng ổ cứng có trong mảng. Tuy nhiên, nhược điểm là nếu chỉ một ổ đĩa bị hỏng, toàn bộ dữ liệu của bạn sẽ mất hết. Dù có rủi ro mất dữ liệu nếu có một ổ hỏng, nhưng với công nghệ hiện đại cũng sẽ giúp giảm thiểu điều này. RAID 0 phù hợp cho game thủ, người làm đồ họa, video số cần truy cập nhanh khối lượng dữ liệu lớn.
RAID 1
Tập trung 100% vào an toàn. RAID sử dụng hai ổ cứng trở lên, dữ liệu được ghi giống hệt nhau lên 2 ổ đĩa (sao y bản chính). Nếu một ổ hỏng, ổ còn lại vẫn hoạt động bình thường với đầy đủ dữ liệu. Bên cạnh đó, dung lượng khi chạy cuối cùng chỉ bằng dung lượng của một ổ đĩa đơn trong mảng (ví dụ: hai ổ 80GB cho RAID 1 chỉ có dung lượng sử dụng là 80GB).
RAID 0+1
Là sự kết hợp ngược lại – strip trước, sau đó mirror các nhóm dữ liệu đã được strip. RAID 0+1 cần tối thiểu 4 ổ đĩa nhưng khả năng chịu lỗi kém hơn RAID 10. Nếu một ổ trong nhóm strip bị lỗi, toàn bộ nhóm đó mất dữ liệu, khiến hệ thống phụ thuộc vào bản sao mirror còn lại. Vì phải cần chuẩn bị tối thiểu 4 ổ đĩa nên chi phí để sở hữu một hệ thống kiểu này khá đắt đỏ, sẽ không phù hợp với những ai đang có ngân sách giới hạn.
RAID 5
Là hệ thống lưu trữ dự phòng nâng cấp hơn so với RAID 1 và RAID 0, có thể cân bằng giữa tốc độ và an toàn. Dữ liệu được chia nhỏ như RAID 0, nhưng có thêm dữ liệu chẵn lẻ (parity data – thông tin dùng để khôi phục) được phân bổ đều trên các ổ. Nếu một ổ hỏng, hệ thống có thể dựa vào dữ liệu parity này để tái tạo lại dữ liệu đã mất. Dung lượng cuối cùng bằng tổng dung lượng của các ổ trừ đi dung lượng của một ổ (ví dụ: 3 ổ 80GB cho RAID 5 sẽ có dung lượng sử dụng là 160GB).
RAID 10 (RAID 1+0)
Kết hợp tốt nhất của tốc độ và an toàn (cần tối thiểu 4 ổ). Đây là sự kết hợp của RAID 1 và RAID 0, dữ liệu vừa được nhân bản để đảm bảo an toàn (RAID 1), sau đó các cặp nhân bản này lại được chia nhỏ để tăng tốc độ (RAID 0). Nếu một ổ đĩa trong một cặp bị lỗi, hệ thống vẫn hoạt động bình thường.
JBOD (Just a Bunch Of Disks)
JBOD là một cách gộp nhiều ổ đĩa thành một không gian lưu trữ lớn duy nhất thông qua bộ điều khiển RAID, nhưng không cung cấp tính năng bảo vệ hay tăng hiệu suất dữ liệu. Ví dụ, JBOD có thể kết hợp các ổ 10GB, 20GB, 30GB để tạo thành một ổ 60GB và chỉ đơn thuần mở rộng dung lượng lưu trữ.
Một số loại RAID khác
- RAID 1E: Là biến thể mở rộng của RAID 1, cho phép sử dụng từ 3 ổ đĩa trở lên. Dữ liệu được sao chép và phân chia trên nhiều ổ đĩa theo cách xen kẽ, không theo cặp cố định.
- RAID 2: Hệ thống này phân chia ổ đĩa thành hai nhóm là nhóm cho dữ liệu phân mảnh (tương tự RAID 0) và nhóm còn lại chứa mã sửa lỗi ECC để khắc phục lỗi dữ liệu. Ưu điểm nổi bật là khả năng duy trì hoạt động ổn định ngay cả khi có ổ đĩa gặp sự cố. Tuy nhiên, nhược điểm của nó nằm ở chi phí triển khai cao, bắt nguồn từ yêu cầu về bộ điều khiển chuyên dụng và số lượng ổ đĩa lớn cần thiết (tối thiểu 10 ổ dữ liệu và 4 ổ ECC).
- RAID 5E: Là biến thể của RAID 5, khác biệt ở không gian dự phòng tích hợp. Điều này cho phép tái tạo mảng bị lỗi ngay lập tức khi có sự cố ổ đĩa.
- RAID 6: RAID 6 tối ưu hơn RAID là vì chúng dùng hai ổ đĩa cho dữ liệu chẵn lẻ (parity), cho phép chịu lỗi hai ổ đồng thời với tối thiểu 4 ổ đĩa. Ưu điểm là bảo mật cao, đọc nhanh và vẫn truy cập dữ liệu ngay cả khi hai ổ lỗi. Nhược điểm là ghi chậm hơn RAID 5 do tính toán parity kép, ảnh hưởng hiệu suất khi lỗi, phức tạp và thời gian rebuild lâu. RAID 6 là sự lựa chọn lý tưởng cho server ứng dụng/tệp cần lưu trữ lớn, ưu tiên bảo mật hơn RAID 5.
- RAID 3, 4 và 7: Các RAID này vẫn còn tồn tại nhưng chúng không còn phổ biến. RAID 3 tương tự RAID 0 về cách phân chia dữ liệu, nhưng dữ liệu parity luôn được ghi vào một ổ đĩa duy nhất.

Tại sao RAID quan trọng cho server, VPS, hosting?
Máy chủ, VPS, hay hosting phải hoạt động liên tục 24/7. Ổ cứng, dù là HDD hay SSD, đều là những linh kiện có tuổi thọ nhất định và vẫn có khả năng hư hỏng nếu sử dụng quá giới hạn. Nếu một máy chủ chỉ có một ổ cứng và nó bị lỗi, toàn bộ website, ứng dụng, dữ liệu của bạn trên đó sẽ biến mất ngay lập tức.
RAID (trừ RAID 0) chính là giải pháp cho những rủi ro này. Công nghệ này giúp máy chủ tiếp tục hoạt động ngay cả khi một ổ cứng bị lỗi, đảm bảo tính liên tục cho dịch vụ và cho quản trị viên thời gian để thay thế ổ cứng hỏng mà không làm gián đoạn kinh doanh.
Điều kiện cần đáp ứng để chạy RAID
Chọn kiểu RAID
Tại Việt Nam, các giải pháp RAID phổ biến bao gồm 0, 1, 0+1 và 5. RAID 0 và 1 là các lựa chọn tối ưu về mặt chi phí nhất vì chúng thường có sẵn trên nhiều dòng BMC, trong khi RAID 0+1 và 5 lại thường xuất hiện trên các thiết bị cao cấp.
- RAID 0: Mang lại tốc độ truyền dữ liệu vượt trội (ví dụ, 4 đĩa có thể chạy hơn 100MB/s), lý tưởng cho các ổ đĩa tạm cần tốc độ cao như cơ sở dữ liệu web. Tuy nhiên, khả năng mất dữ liệu cũng tăng theo số lượng ổ đĩa, nên không thích hợp để lưu trữ lâu dài. Nếu cần lưu trữ lâu dài với tốc độ cao, nên kết hợp RAID 0+1 với điều kiện tài chính cho phép.
- RAID 1: Đơn thuần là tạo bản sao y hệt ổ chính, không tăng tốc độ. Đây là lựa chọn lý tưởng cho việc lưu trữ các dữ liệu cực kỳ quan trọng như thông tin khách hàng hoặc tài khoản. Ngoài ra, bạn cũng có thể cân nhắc bổ sung các khay tráo đổi nóng để phục hồi dữ liệu nhanh chóng khi cần thay thế ổ đĩa.
- RAID 5: Hiện nay, đây là loại RAID được lựa chọn hàng đầu cho mọi loại máy tính nhờ khả năng cân bằng giữa sửa lỗi và tăng tốc, đặc biệt tối ưu khi xây dựng hệ thống từ 4 ổ cứng trở lên.
- RAID 0+1 hay RAID 50: Mang lại các ưu điểm của các loại RAID thành phần, tuy nhiên, cần cân nhắc kỹ lưỡng và chỉ sử dụng khi thực sự cần thiết do chi phí linh kiện cao.
| Tên RAID | Bảo vệ dữ liệu | Dung lượng đĩa được sử dụng | Tốc độ đọc | Tốc độ ghi | Tự động thay thế đĩa bị hỏng | Số lượng đĩa tối thiểu |
|---|---|---|---|---|---|---|
| RAID 0 | No | 100% | www | www | No | 2 |
| RAID 1 | Yes | 50% | ww | ww | No | 2 |
| RAID 1E | Yes | 50% | ww | ww | No | 3 |
| RAID 10 | Yes | 50% | ww | ww | No | 4 |
| RAID 5 | Yes | 67-94% | www | w | No | 3 |
| RAID 5E | Yes | 50-88% | www | w | Yes | 4 |
| RAID 6 | Yes | 50-88% | ww | w | No | 4 |
Chọn phần cứng
Khi chọn phần cứng cho hệ thống RAID, bạn cần chú ý đến hai thành phần chính: bộ điều khiển RAID và ổ cứng.
Bộ điều khiển RAID
Bộ điều khiển RAID có hai loại chính: tích hợp và rời.
- Chipset tích hợp: Thường có trên bo mạch chủ, phổ biến nhất là các hãng như Intel và NVIDIA. Ưu điểm là độ trễ thấp và dễ sử dụng. Nhược điểm là tính năng và phần mềm hỗ trợ còn hạn chế.
- Card rời: Các card từ Promise, Silicon Image hay Adaptec mang lại nhiều tính năng và phần mềm phong phú hơn. Mặc dù có độ trễ cao hơn một chút, nhưng chúng lại dễ dàng nâng cấp và thay thế. Lưu ý: Một số dòng cũ như Silicon Image Sil3112 có thể gây mất dữ liệu khi thay đổi cấu hình RAID.
Với các bo mạch chủ hiện đại, hầu hết đều hỗ trợ RAID 5. Về giao tiếp, SATA là lựa chọn tối ưu vì tốc độ và hiệu suất cao hơn so với PATA. Nếu có ngân sách, bạn có thể cân nhắc các card điều khiển chuyên nghiệp có hỗ trợ RAM để tăng tốc độ xử lý.
Lựa chọn ổ cứng
Để đạt hiệu suất tốt nhất, bạn nên chọn các ổ cứng có các đặc điểm sau:
- Tốc độ truy xuất thấp: Thời gian truy xuất (Access Time) càng nhỏ, dữ liệu càng được tìm thấy nhanh.
- Bộ đệm lớn: Nên chọn ổ cứng có bộ đệm (cache) từ 8MB trở lên.
- Ổ cứng giống nhau: Sử dụng các ổ cứng cùng loại, cùng dung lượng và cùng nhà sản xuất để đảm bảo hiệu suất RAID tối ưu.
- Công nghệ hiện đại: Các công nghệ như NCQ của Seagate có thể giúp cải thiện hiệu suất làm việc.
Cài đặt RAID
Cài đặt RAID chủ yếu được thực hiện trong BIOS của bo mạch chủ và RAID Controller (bộ điều khiển RAID). Các bước cài đặt cơ bản như sau:
- Kết nối và kích hoạt: Sau khi cắm các ổ cứng vào đúng vị trí, bạn vào BIOS để bật bộ điều khiển RAID và chỉ định các cổng tương ứng.
- Truy cập BIOS RAID: Sau khi khởi động lại máy, bạn cần nhấn tổ hợp phím đặc biệt (thường hiển thị trên màn hình) để vào giao diện BIOS của RAID.
- Thiết lập RAID:
- Chỉ định ổ cứng: Chọn các ổ cứng sẽ tham gia vào hệ thống RAID.
- Lựa chọn kiểu RAID: Chọn loại RAID mong muốn (ví dụ: RAID 0, 1, 5).
- Cài đặt Block Size: Đây là một thông số quan trọng ảnh hưởng đến hiệu suất. Block Size (kích thước khối) cần được thiết lập phù hợp với loại dữ liệu bạn thường xuyên sử dụng. Nếu dùng nhiều file nhỏ (ví dụ: tài liệu), bạn nên chọn Block Size nhỏ. Nếu dùng nhiều file lớn (ví dụ: phim, ảnh), bạn nên chọn Block Size lớn để tối ưu hiệu suất, đặc biệt với RAID 0.
- Cài đặt hệ điều hành: Sau khi hoàn tất các bước trên, bạn có thể cài đặt Windows như bình thường. Tuy nhiên, bạn cần chuẩn bị driver RAID và nhấn F6 khi được yêu cầu trong quá trình cài đặt để thêm driver này.
- Cài đặt tiện ích: Sau khi hệ điều hành hoạt động, hãy cài đặt các phần mềm quản lý RAID (như Intel Application Acceleration RAID Edition) để tận dụng tối đa các tính năng của hệ thống.
Lưu ý
Câu hỏi thường gặp
RAID technology là gì?
RAID technology (công nghệ RAID) là phương pháp kết hợp nhiều ổ đĩa vật lý (như HDD hoặc SSD) thành một hoặc nhiều đơn vị logic để tăng cường hiệu suất đọc/ghi dữ liệu, cải thiện độ tin cậy và khả năng sẵn sàng của dữ liệu, hoặc cả hai.
Card RAID là gì?
Card RAID, hay còn gọi là Bộ điều khiển RAID (RAID Controller), là một thiết bị phần cứng chuyên dụng (thường là một card mở rộng cắm vào khe PCIe trên bo mạch chủ hoặc được tích hợp sẵn trên bo mạch chủ) có nhiệm vụ quản lý và điều phối hoạt động của nhiều ổ đĩa để tạo thành một hệ thống RAID.
Kết luận
Qua bài viết, hy vọng bạn đã hiểu rõ hơn về công nghệ RAID, các cấp độ hoạt động và khi nào nên áp dụng để tối ưu hóa hệ thống lưu trữ của mình. Hãy lựa chọn cấp độ RAID phù hợp nhất với nhu cầu cụ thể của bạn để đảm bảo hiệu suất và an toàn cho dữ liệu. Nếu muốn tìm hiểu thêm về bảo mật và quản trị website, bạn có thể theo dõi các bài viết tiếp theo của mình.




