Monitoring w centrum danych pozwala zweryfikować status infrastruktury oraz aplikacji i usług – o każdej porze. Gwarantuje to bezpieczeństwo i wydajność wszystkich środowisk utworzonych dla klientów.
W ramach monitoringu inżynierowie stale obserwują wybrane parametry oraz zbierają logi ze sprzętu i oprogramowania do zarządzania chmurą. Dyżurni reagują na zdarzenia według wypracowanych procedur, a wszystkie informacje są regularnie analizowane pod kątem występowania anomalii.
Każdy monitorowany parametr ma ustalone wartości progowe, które podzielone są na poziomy (severity) i warunkują sposób reakcji na zdarzenie. Przykładowo, przy poziomie krytycznym wskazującym na awarię zespoły w centrach danych reagują natychmiast.
Poniżej znajdują się przykłady parametrów standardowo monitorowanych w centrach danych.
Monitoring centrum danych #
Aby zapewnić stabilne działanie centrum danych stale monitorowane są m.in.:
- Bezpieczeństwo fizyczne (kontrola dostępu, systemy ochrony przeciwpożarowej),
- Warunki klimatyczne (temperatura, wilgotność),
- Zasilanie (w tym UPSy),
- Sprzęt (m.in.: serwery, macierze, przełączniki),
- Dostępność łącz internetowych,
- Dostępność usług chmurowych, paneli web do zarządzania.
Monitoring w modelach PaaS i SaaS #
Ponadto w przypadku usług chmurowych w modelach PaaS i SaaS inżynierowie monitorujemy m.in.:
- Dostępność maszyn wirtualnych (VM) i wydajność działania znajdujących się na nich systemów operacyjnych (OS),
- Usługi – status usług działających na maszynach wirtualnych (www, bazy danych, aplikacje),
- Dostępność hostowanych usług WWW,
- Status wykonania kopii zapasowych.
Monitoring maszyn wirtualnych #
Jakie parametry maszyn wirtualnych są monitorowane?
- Dostępność hosta,
- Obciążenie procesora,
- Obciążenie dysków,
- Zajętość pamięci RAM i swap,
- Zajętość dysków i szybkość przyrostu danych,
- Synchronizacja czasu – różnica względem serwera czasu.
W przypadku monitoringu konkretnych usług/aplikacji wiele zależy od ich specyfiki. Zawsze sprawdzane jest ich działanie (czy liczba aktywnych procesów zgadza się z oczekiwaną) oraz status (tzw. healthcheck). Dla niestandardowych aplikacji zestaw parametrów do monitorowania wypracowywany jest razem z klientem.