NVMe và SAS Disk, cách chuyển pdisk sang hdisk với chuẩn SAS
Trước khi đi vào bài toán thực tế cần phải hiểu một số thứ liên quan tới disk:
Thứ nhất, disk chuẩn NVMe, dòng disk này không được quản lý bởi raid controller mà được quản lý trực tiếp bởi CPU theo kiến trúc mới là: NVMe SSD --> PCIe --> CPU --> NVMe driver --> OS
Thứ hai, disk chuẩn SAS, dòng disk này được quản lý với raid controller theo kiến trúc cổ điển là: Disk --> RAID Controller --> OS
Thứ ba, pdisk là là các physical SAS SSD disks (đĩa vật lý riêng lẻ)
Thứ tư, hdisk tương ứng với pdisk đó (được AIX nhận diện và có thể dùng làm PV).
Chú ý rằng, hiểu theo một cách thông thường thì pdisk sẽ có hdisk tương ứng với nó (ví dụ pdisk1 --> hdisk1, pdisk2 --> hdisk2...). Tuy nhiên, về bản chất RAID sẽ tạo ra hdisk tiếp theo trong list hdisk hiện có của OS. Điều này có nghĩa rằng, trước khi add 2 disk vào, trong OS đã có hdisk (hdisk10 chẳng hạn) thì hdisk tương ứng của pdisk sẽ là hdisk tiếp theo trong bảng list PV. Trong trường hợp này, pdisk2 --> hdisk11 và pdisk3 --> hdisk12.
Theo đó, bài toán thực tế dưới đây chỉ xảy ra với disk được quản lý bởi raid controller:
Server IBM S924, có 2 disk vật lý là (hdisk0 và hdisk1 – chuẩn SAS SSD). Hệ điều hành AIX 7.1 được cài đặt trên hdisk0 và được mirror sang hdisk1.
Nghĩa rằng, server không còn disk vật lý để thực hiện backup OS (thực hiện bằng alter_disk).
Khi này, giả sử bổ sung thêm 2 disk vật lý mới (hdisk2 và hdisk3), cùng chủng loại với hdisk0 và hdisk1.
Tuy nhiên, khi cắm 2 disk vật lý mới vào S924, OS chỉ nhận ở mức pdiskX (trong trường hợp này là pdisk2 và pdisk3), chứ không nhận ở mức hdisk như thông thường.
Hiện tượng này là hoàn toàn bình thường trong AIX.
Để giải thích cho hiện tượng OS không nhận hdisk này, cần phải hiểu rằng, disk vật lý được AIX quản lý thông qua SAS Controller (thường là sas0, đôi khi là sas1...).
Khi này, để liệt kê các disk vật lý sẽ dùng lệnh:
#sissasraidmgr -L -l sissas0 -j3
Ở output của lệnh này, sẽ thấy 2 item là Member (đây là hdisk0 và hdisk1) và 2 item là Candidate (nó là pdisk2 và pdisk3).
Mục đích, là phải chuyển được từ Candidate sang Member cho disk2 và disk3.
Bản chất của việc này là tạo một SSD Array mới từ SAS Controller. Thực hiện việc này bằng lệnh:
#sissasraidmgr -C -r 0 -z pdisk2
Đôi khi lệnh này sẽ báo lỗi “0940-008 64 Kb not a supported stripe size for raid 0.” Lỗi này xảy ra vì controller SAS RAID PCIe3 (trong trường hợp là sissas0 – PCIe3 x8 SAS RAID Internal Adapter 6Gb) chỉ hỗ trợ stripe size 256 KB cho các array trên 4K sector SSD. Khi này, ban thay bằng lệnh:
#sissasraidmgr -C -r 0 –s 256 -z pdisk2
Lệnh này sẽ mất khoảng vài phút (tùy thuộc vào dung lượng của disk).
Thực hiện tương tự với pdisk3.
Sau khi lệnh trên chạy xong, check lại hdisk trên #lspv
Nếu chưa có thì cần scan lại (#cfgmgr hoặc #cfgmgr –v)
✎ Thay đổi state của path (hay của LUN được map từ Storage)
✎ Cấu hình mirror os lên hdisk khác
✎ Thay đổi MTU cho interface từ 1500 lên 9000
✎ Tản mạn đôi chút về PVID của disk
✎ Vòng lặp for trong command daily
✎ Tìm process đang chiếm dụng nhiều tài nguyên như RAM, CPU
✎ Xóa bỏ hoàn toàn cấu hình của interface network
✎ Restore OS từ alter disk copy
✎ Thay disk chứa bootlist first
✎ Bỏ qua bước yêu cầu đổi mật khẩu của user khi login



