Sự cần thiết phải có hệ thống giám sát Công nghệ thông tin
04:48' CH - Thứ tư, 04/05/2016
Ứng với mỗi hệ thống nghiệp vụ, kèm theo nó là hàng chục máy chủ và thiết bị lưu trữ xử lý dữ liệu khác nhau, chạy trên nhiều nền tảng phần cứng của các hãng khác nhau. Mỗi máy chủ lại sử dụng các phần mềm hệ điều hành khác nhau như Windows, HP Unix, Linux… Trên đó các nhà cung cấp đã triển khai giải pháp riêng của mình với công nghệ rất khác nhau. Mạng lưới các điểm giao dịch của ngân hàng gồm hàng trăm tới hàng ngàn thiết bị ATM, phòng giao dịch kết nối tập trung trên toàn quốc.
Theo thời gian các sản phẩm dịch vụ của sẽ tăng lên liên tục theo nhu cầu kinh doanh và sự sức ép cạnh tranh với các đối thủ. Hệ thống công nghệ cũng phải bùng nổ nhanh chóng tới hàng ngàn trang thiết bị, hàng ngàn các tiểu hệ thống (sub-system) phải duy trì vận hành liên tục 24x7.
Để đảm bảo sự vận hành an toàn của một hệ thống công nghệ đồ sộ, nhiều thành phần của nhiều nhà cung cấp khác nhau là một việc rất phức tạp, trong khi số lượng nhân sự CNTT có hạn.
Việc đảm bảo duy trì ổn định của hệ thống được thực hiện bằng một số cách
Cách 1: Chỉ người sử dụng phản ánh khi gặp khó khăn, gọi tới bộ phận hỗ trợ. Các chuyên viên quản trị hệ thống mới bắt đầu liên hệ lại với người sử dụng, tìm hiểu mô phỏng tình huống lỗi, dò tìm nguyên nhân, đưa ra phương án khắc phục, thông báo lại cho người sử dụng tiếp tục thử lại. Cách này chỉ áp dụng được với các doanh nghiệp hoạt động quy mô nhỏ, ở đó vai trò của công nghệ không ảnh hưởng nhiều đến hoạt động kinh doanh cũng như hình ảnh uy tín của doanh nghiệp.
Cách 2: Mỗi hệ thống của một nhà cung cấp thường kèm theo một số lệnh hoặc công cụ cơ bản để giúp cho người quản trị chủ động kiểm tra sức khỏe của bản thân. Người quản trị hệ thống phải định kỳ truy cập vào từng hệ thống, thực thi một số lệnh nhất định để kiểm tra, dựa trên kinh nghiệm của bản thân để phán đoán hệ thống đang ổn định hay không. Nhược điểm của phương án này bao gồm
Số lượng nhân sự cao cấp sẽ bị tăng lên nhanh chóng. Bởi vì mỗi hệ thống đòi hỏi trình độ hiểu biết công nghệ rất khác nhau, trong khi số lượng hệ thống sẽ tăng lên rất nhanh theo số lượng sản phẩm dịch vụ. ABC không thể đầu tư tới hàng trăm nhân sự CNTT cao cấp để duy trì ổn định cho hàng ngàn dịch vụ CNTT sau này.
Khó có thể chủ động phát hiện sự cố nhanh chóng. Khoảng thời gian định kỳ giữa 2 lần khám nghiệm hệ thống, vẫn có thể xảy ra sự cố làm cho hệ thống gián đoạn và phải bị động khắc phục
Phụ thuộc nhiều vào kinh nghiệm của từng cá nhân khi đánh giá vấn đề để quyết định có nghiêm trọng hay không. Cùng một hiện tượng cảnh báo, nhưng người không có kinh nghiệm vẫn thấy hệ thống đang hoạt động bình thường.
Cách 3: Một hệ thống giám sát độc lập sẽ định kỳ đánh giá từng thành phần của hệ thống và quản trị tập trung trên một cơ sở dữ liệu/cơ sở tri thức. Hệ thống giám sát hoạt động liên tục bằng cách gửi lệnh định kỳ (ví dụ 5 phút, 10 phút, 60 phút…) tới tất cả các tiểu hệ thống cần theo dõi, nhận kết quả trả về và lưu trữ, phân tích so sánh lịch sử (history), đưa ra các cảnh báo cần thiết tới đúng người cần xử lý phản ứng. Một số trường hợp đơn giản, hệ thống cảnh báo cũng có thể tự khắc phục sự cố theo kịch bản biết trước và báo cáo cho con người sau. Ưu điểm của phương án này có rất nhiều, trong đó cơ bản là
Chủ động đoán biết được lỗi tiềm ẩn và đưa ra cách khắc phục trước khi xảy ra
Tần suất giám sát cao, tự động hóa nên nhân lực quản trị sẽ ít hơn, chi phí nhân sự rẻ hơn
Có khả năng theo dõi được lịch sử của dịch vụ, giúp người lãnh đạo CNTT có bức tranh tổng thể về hệ thống dịch vụ, cải thiện những điểm còn yếu trong hệ thống.
Cách 3 là cách mà hầu hết các hệ thống lớn đều phải triển khai.