Jak z sukcesem zarządzać awariami?

Awarie są nieprzewidywalne i wyjątkowo często zdarzają się po godzinach pracy administratorów. Pracownik działu IT zazwyczaj potrzebuje kilku godzin na powrót do przedsiębiorstwa i zajęcie się awarią. A przecież od ciągłości pracy systemu informatycznego może być uzależniony los firmy. Dlatego warto zlecić ten obszar działania ekspertom.                                         cloud computing            

Cloud computing

Inżynierowie itelligence, jako operatorzy data center, obserwują stały przyrost aplikacji i systemów wykorzystywanych przez przedsiębiorstwa. Wyjątkowym motorem rozwoju rozwiązań biznesowych jest cloud computing, który dzięki swojej elastyczności i skalowalności zyskuje coraz szersze grono klientów biznesowych. Usługi chmurowe są najprostszą odpowiedzą na pytanie „w jaki sposób i przy pomocy jakich narzędzi zapanować nad firmowym środowiskiem IT?”. Cloud computing jest doskonałym sposobem na efektywne zarządzanie dużą i rosnącą ilością zdarzeń i elementów, które są związane z działaniem systemów informatycznych i całej infrastruktury teleinformatycznej przedsiębiorstw.

Jedno z humorystycznych praw Murphy’ego mówi, że jak coś ma się zepsuć, to awaria wydarzy się w czasie nieobecności kompetentnej osoby. Niestety awarie są nieprzewidywalne i wyjątkowo często zdarzają się po godzinach pracy administratorów. Pracownik działu IT zazwyczaj potrzebuje kilku godzin na powrót do przedsiębiorstwa i zajęcie się awarią. A przecież od ciągłości pracy systemu informatycznego może być uzależniony los firmy. Często awaria jednego systemu np. magazynowego zatrzymuje całą produkcję, a straty są liczone w ogromnych kwotach.

Weryfikacja zdarzeń

Z pomocą przychodzi dział monitoringu firmy itelligence, który monitoruje infrastrukturę IT klientów. Doświadczeni eksperci w trybie 24 na 7, 365 dni w roku analizują i weryfikują środowiska klientów i zgłaszają odpowiednim osobom zapotrzebowanie na działanie.

Analizowanie aktualnej sytuacji środowiska IT wykonywane jest za pomocą autorskiego narzędzia – IT Admin. Jest to aplikacja, która ukazuje alerty pochodzące z różnych źródeł: infrastruktury, aplikacji, systemów, sieci.

Ten system umożliwia korelację i sprawną reakcję na wszelkie zdarzenia w oprogramowaniu i infrastrukturze klienta.

Oprócz tego rozwiązania wykorzystujemy IT Task. To rozwiązanie generuje automatycznie zadania do wykonania przez dział monitoringu. IT Task odnosi się do działań których nie można wykonać automatycznie. Spowodowane jest to brakiem odpowiedniego interfejsu. Dotyczy to zadań które muszą być wykonane na poziomie sprzętu, systemów operacyjnych, czy też na poziomie aplikacji i baz danych. Wszystko zależy od warunków, które zostaną wcześniej określone.

Analiza i reakcja

itelligence w zakresie monitoringu systemów klientów korzysta z różnych narzędzi, jednak zawsze są to najwyższej klasy rozwiązania od renomowanych dostawców typu IBM, SAP, NetApp, Zabbix, HPE.

Jeśli w jednym z monitorowanych środowisk wystąpi awaria konsultant dostaje o tym informację na swoją konsolę. Identyfikuje do jakiego klienta należy system, jaki tryb obsługi został do danego klienta/systemu przypisany, weryfikuje źródło alertu (infrastruktura, aplikacja, system operacyjny, sieć), jaki jest jego status – analizowane są wszystkie najistotniejsze elementy. W dalszej kolejności zdarzenie jest rejestrowane w systemie ticketowym, tam jest przetwarzane i analizowane. Wprowadzona jest również cała historia i informacje o tym co zostało wykonane, w jakim zakresie, a także kogo poinformowano i jaki jest status alertów.

Konsultanci itelligence dziennie rejestrują około 4,5 tys. alertów. Bieżącą analizą tej puli zajmuje się 10 osób w dziale monitoringu. Zespół monitoruje systemy działające w około 30 lokalizacjach.

Jakie obszary są monitorowane przez itelligence? W uproszczeniu są to informacje o procesach, systemach, aplikacjach, infrastrukturze. itelligence, jako platynowy partner SAP, specjalizuje się w systemach wspomagających zarządzanie rynkowego lidera. Nie mniej ważny jest nadzór nad systemami operacyjnymi, bazami danych (Oracle, SQL, DB MAX, HANA) i aplikacjami front-endowymi, a także utylizacja i wydajność zasobów sprzętowych, platforma VMware (również na poziomie hostów), platforma Power/IBM, systemy storygowe NetApp/IBM Storewise/HPE 3Par, systemy zasilania.                          cloud computing

Przejrzyste interwencje

Do monitorowania stanu infrastruktury w obszarze bezpieczeństwa komputerów, badania anomalii i usług wykorzystywana jest także technologia SIEM (Security Information and Event Management). Rozwiązania tej klasy dostarczają w czasie rzeczywistym analizy alertów bezpieczeństwa generowanych przez sprzęt i aplikacje.  Elementy składowe SIEM umożliwiają wykonywanie korelacji różnymi technikami w celu integracji różnych źródeł aby przekształcić dane w użyteczną informację. Dodatkowo, narzędzia mogą pobierać dane o wydarzeniach i budować na ich podstawie wykresy informacyjne, aby pomóc w wyświetlaniu wzorców lub identyfikowaniu aktywności, które nie tworzą standardowego wzorca.

Zespół monitorowania itelligence w bardzo łatwy i przejrzysty dla klienta sposób nadzoruje różne punkty infrastruktury i usług, które są związane z funkcjonowaniem środowisk IT. Dzięki wsparciu ekspertów użytkownicy są natychmiast informowani o każdym niepożądanym zdarzeniu w ich teleinformatyce, a to oznacza, że mogą natychmiast zająć się usuwaniem awarii, a co za tym idzie minimalizują ryzyko przestoju firmy, czyli optymalizują możliwe straty.                       https://itelligencegroup.com/pl/

Rola monitoringu w IT:

  • aktywne analizowanie sytuacji na poziomie systemów operacyjnych;
  • pasywne wykonywanie zadań;
  • generowanie zgłoszeń oraz przekazywanie informacji odpowiednim osobom:
    • informacja do dyżurnego;
    • informacja do klienta;
    • koordynowanie zgłoszeń z kooperantami zewnętrznymi.

Autor: Bartosz Pióro, IT Senior Consultant, IT Monitoring architect, itelligence sp. z o.o.

Zapraszamy do kontaktu!

Podobne posty

Czytaj dalej

Kontakt
Kontakt

Skontaktuj się z nami