High Availability (HA, wysoka dostępność) to sposób projektowania infrastruktury, w którym systemy i komponenty działają nieprzerwanie przez określony, długi czas.
Rozwiązania HA zapewniają niezawodność na najwyższym możliwym poziomie, jednocześnie minimalizując ryzyko wystąpienia awarii i przestojów. przypadku wystąpienia awarii w jednym z elementów środowiska pozwala utrzymać dostępność całego systemu, sieci czy aplikacji.
Do metod uzyskania wysokiej dostępności zalicza się między innymi:
- Redundancję (nadmiarowość),
- Load-balancing,
- Klastrowanie,
- Replikację,
- Monitoring.
Czym różni się High Availability od Disaster Recovery? #
Architektura High Availability pozwala użytkownikom i aplikacjom pracować bez przerw lub z minimalną przerwą również w przypadku wystąpienia błędu lub awarii związanej z uszkodzeniem sprzętu fizycznego lub maszyn wirtualnych.
Disaster Recovery to natomiast zestaw polityk, procedur i narzędzi, które ułatwiają i przyspieszają przywrócenie działania systemów w przypadku poważnych problemów, takich jak rozległy atak hakerski, długotrwała przerwa w dostawie prądu, pożar czy powódź.
Posiadanie Disaster Recovery pozwala na proste przepięcie środowiska do drugiego, zapasowego ośrodka Data Center nawet przy planowanych pracach serwisowych (planowana przerwa w dostawie prądu, prace serwisowe w serwerowni itp.)
Chociaż różnią się zastosowaniem, zarówno Disaster Recovery, jak i High Availability wykorzystują redundancję (nadmiarowość), kopie zapasowe i replikację. Dzięki tym rozwiązaniom utrzymują bądź przywracają dostęp do danych i systemów.
Sprawdź rozwiązania Disaster Recovery w MAIN
Korzyści płynące z High Availability #
HA ma za zadanie zapobiegać przestojom w działaniu systemów, usług i aplikacji. Każda przerwa w ich działaniu może wiązać się z utratą dochodu, obniżeniem produktywności czy spadkiem opinii o firmie. Tym samym, High Availability umożliwia:
- Zachowanie ciągłości biznesowej – najważniejsze aplikacje i usługi działają bez zaburzeń, dane biznesowe są stale dostępne, a potencjalne błędy i awarie są niezauważalne dla użytkowników,
- Poprawę doświadczeń użytkowników (User Experience) – szybkość i stabilność działania usług, np. sklepów internetowych, znacznie podnoszą poziom zaufania i zadowolenia klientów, a tym samym przekładają się na wyższe przychody
- Zdobycie przewagi nad konkurencją – wysoka dostępność pomaga firmom zagwarantować stały i nieograniczony dostęp do ich usług, co pozwala się wyróżnić spośród innych przedsiębiorstw na rynku.
High Availability – rozwiązania technologiczne i najlepsze praktyki #
Aby architekturę IT można było nazwać “wysoko dostępną”, musi cechować się wykorzystaniem kilku niezbędnych rozwiązań technologicznych wprowadzonych zgodnie z najlepszymi praktykami. Należą do nich między innymi:
- Tworzenie klastrów hardware i software wysokiej dostępności,
- Redundancja (nadmiarowość) elementów architektury IT,
- Load-balancing,
- Replikacja oraz kopie zapasowe,
- Stały monitoring i automatyzacja procesów.
Klastry wysokiej dostępności #
Klastry wysokiej dostępności to serwery bądź maszyny wirtualne połączone w jedną grupę i działające jako jednolity system – dzielą między siebie obciążenia i stale synchronizują dane. W przypadku, gdy jedna z maszyn doświadczy awarii, pozostałe natychmiast przejmują ruch i świadczenie usługi. Korzystanie z klastrów wysokiej dostępności pomaga upewnić się, że nie istnieje pojedynczy punkt awarii dla krytycznego IT, jak też zmniejsza lub eliminuje przestoje.
Budując docelowe środowisko dla jednego z naszych klientów – Mikomax – skonfigurowaliśmy dwa serwery HPE ProLiant RL300 Gen11 z procesorami Ampere Altra w klastrze właśnie dla zabezpieczenia wysokiej dostępności.
Dowiedz się więcej o wdrożeniu chmury prywatnej z HA dla firmy Mikomax
Redundancja #
Ważną częścią systemu wysokiej dostępności jest redundancja, czyli posiadanie zapasowego komponentu gotowego do działania, gdy główny ulegnie awarii.
Wspomniane wyżej klastry wysokiej dostępności są przykładem zastosowania redundancji (nadmiarowości) w projektowaniu architektury IT. Aby jednak osiągnąć wysoką dostępność nie wystarczy nadmiarowość jednego jej elementu. Każda „nieredundantna” część stanowi pojedynczy punkt awarii, który może przyczynić się do przerwania ciągłości działania środowiska IT. Dla przykładu, jeśli grupa serwerów jest podłączona tylko do jednego przełącznika sieciowego (switcha), jego awaria spowoduje niedostępność całej grupy.
Architektura IT o wysokiej dostępności obejmuje redundancję:
- Infrastruktury,
- Źródeł energii,
- Personelu,
- Sprzętu,
- Oprogramowania,
- Danych.
Redundancja na przykładzie centrum danych MAIN
Load-balancing #
Systemy wysokiej dostępności wykorzystują load-balancing do dystrybucji ruchu pomiędzy wieloma serwerami lub maszynami wirtualnymi (VM) w celu optymalizacji ich wydajności i niezawodności.
Load-balancer to wyspecjalizowana VM, które przechwytuje żądania przeznaczone dla grupy maszyn i rozdziela pomiędzy nie ruch, tak aby żadna nie była przeciążona. W przypadku awarii jednej z nich, load-balancer automatycznie przekierowuje jej obciążenie na pozostałe maszyny.
Architektura oparta o HA skraca latency, czyli czas pomiędzy wysłaniem zapytania, a procesowaniem go przez serwer. Jak to wygląda w praktyce? W przypadku witryny internetowej o dużym natężeniu ruchu, system każdego dnia otrzymuje miliony żądań użytkowników. Load-balancing zapewnia, że treści z serwerów internetowych docierają do użytkowników szybko i bez zakłóceń.
Wdrażając usługi dla jednego z naszych klientów – Turbine Analytics – skorzystaliśmy z możliwości load-balancera, aby zoptymalizować wykorzystanie publicznych adresów IP.
Przeczytaj więcej o rozwiązaniach High Availiability w naszym wdrożeniu dla Turbine Analytics
Replikacja danych #
Replikacja danych umożliwia tworzenie stale aktualizowanych kopii danych w różnych lokalizacjach. W ten sposób powstają dwa lub więcej ośrodki, które posiadają taką samą konfigurację i ten sam zbiór danych. W przypadku awarii możliwe jest awaryjne przełączenie pomiędzy nimi, dzięki czemu minimalizujemy przestoje, utratę danych czy spadek wydajności operacyjnej.
Przykładem wdrożenia replikacji danych jest infrastruktura hybrydowa, którą zbudowaliśmy dla firmy ProService Finteco. Składa się ona z dwóch ośrodków, działających w trybie Active-Active. Replikacja pomiędzy nimi jest zautomatyzowana, oba centra danych są redundantne, a łącze DWDM zapewnia wysoką jakość i szybkość połączenia między nimi. W tej konfiguracji każdy ośrodek może pełnić funkcję podstawowego centrum danych.
Dowiedz się więcej o wykorzystaniu rozwiązań wysokiej dostępności w ProService Finteco
Monitoring i automatyzacja #
Aby zachować wysoką dostępność, kluczowe jest stosowanie narzędzi do ciągłego monitorowania stanu środowiska IT. W przypadku wykrycia awarii administratorzy mogą szybko zidentyfikować problemy, co pozwala na ich sprawne rozwiązanie i zmniejszenie ryzyka przestojów.
Równie istotnym elementem procesu jest weryfikacja wykrytych problemów po ich identyfikacji oraz podjęcie decyzji o przełączeniu usług. Zdarza się, że ostateczne rozwiązanie problemu wymaga więcej czasu, jednak dzięki możliwości przełączenia do drugiego ośrodka z aktualnym stanem lub uruchomienia środowiska z repliki bądź backupu (np. sprzed momentu wystąpienia awarii), usługi i biznes mogą działać dalej bez większych zakłóceń.
Przykładem wdrożenia monitoringu w celu osiągnięcia wysokiej dostępności jest konfiguracja, którą stworzyliśmy na potrzeby firmy Omecon. Zapewnia ona:
- Informowanie o problemach i awariach w infrastrukturze na bieżąco,
- Informacje o problemach wydajnościowych.
- Opracowany system powiadomień pozwala na przeciwdziałanie awariom infrastruktury i działania prewencyjne.