13 lutego br. miała miejsce awaria naszego systemu, w wyniku której użytkownicy mieli problemy z wykonywaniem połączeń, rejestracją do panelu oraz działaniem usług. Dział Techniczny przeprowadził analizę tej sytuacji i zgodnie z obietnicą poniżej przedstawiamy jej wyniki.
WYNIKI ANALIZY
Główną przyczyną awarii 13 lutego br. było przeciążenie bazy danych. Spowodowane to było niespotykanym dotychczas zestawieniem kampanii mass dialowych (scenariusz zaistniały 13.02 nie zawierał się w testach systemu). W związku z tym doszło do wykonania w jednym czasie wielu powtarzanych operacji bazodanowych. Rezultatem było przeciążenie serwera. W celu ochrony spójności danych zgromadzonych w bazie należało poczekać do zakończenia wykonywania operacji na danych w stanie przeciążenia.
WNIOSKI
Kwestia bezpieczeństwa i stabilności platformy jest dla nas bardzo istotna. Aby nie dopuścić do podobnych awarii w przyszłości (lub gdy problemy wystąpią – zmniejszyć ich zasięg), zmieniona została platforma sprzętowa dla bazy danych. Dzięki temu system dysponuje większą mocą obliczeniową oraz wydajniejszą pamięcią masową. Równolegle do prac sprzętowych podjęte zostały działania, wspólnie z dostawcą oprogramowania, mające na celu prace nad optymalizacją struktury i parametrów pracy bazy danych.
Niezależnie od tego, pracujemy nad procesem przeniesienia kont na nową wersję platformy, która zapewni naszym użytkownikom większe bezpieczeństwo, niezależność elementów systemu oraz pozwoli na korzystanie z nowych możliwości. Jest to proces bardzo złożony, do którego chcemy się przygotować jak najlepiej. Będzie on przeprowadzony jeszcze w tym roku.
Łukasz Ratajczyk
Dyrektor Techniczny FreecoNet