Tag Archives: Kopie zapasowe i archiwizacja danych

Bezpieczeństwo danych i sieci – Kopie zapasowe i archiwizacja danych

podrozdział pracy inżynierskiej

Niezależnie od ciągłego postępu technicznego sprzętowe awarie systemu i przypadki losowe są możliwe. Konsekwencje jakie to niesie za sobą dla skomputeryzowanej instytucji są łatwe do wyobrażenia – zniszczone konta księgowe, listy płacowe, rachunki, należności wykazy produkcyjne i wiele innych ważnych danych. Najprostszą metodą obrony jest utrzymanie w miarę aktualnych kopii zapasowych BACKUP. Do takiego zastosowania potrzebny jest nośnik wielokrotnego zapisu o odpowiedniej pojemności np. dyski magnetooptyczne, taśmy magnetyczne, dyski magnetyczne, płyty CD wielokrotnego zapisu CD-RW itp. Mogą w tym celu być wykorzystane takie urządzenia jak: Jukebox magnetooptyczny, pojedyńczy napęd magnetooptyczny, streamer, nagrywarka CD-RW lub małej pojemności napęd ZIP a nawet dyski twarde stacji roboczych i innych serwerów.

Od oprogramowania backupu wymagamy automatyzacji procesu backupu, zarządzania nośnikami, łatwego procesu odtwarzania i wyszukiwania danych. Istnieje wiele systemów składowania i archiwizacji danych: ARCserve firmy Cheyenne, NetWorker firmy Legato Systems, Backup Exec firmy Seagate Software, FileSafe i FileTalk firmy Mountain, MaynStream firmy Maynard, The Network Archivist firmy Palindrome, FileSECURE i OverNet firmy Tallgrass Technologies oraz wiele innych programów Backup dostarczanych ze sprzętem do tworzenia kopii zapasowej lub w sieciowych systemach operacyjnych.

W systemie NetWare 5 program składujący musi radzić sobie ze składowaniem nie tylko zawartości zbiorów, ale również takich informacji, jak dysponenci plików i katalogów, atrybuty rozszerzone plików i katalogów, przestrzenie nazewnicze, strzeżone zbiory systemowe związane z replikami NDS, pliki poddane kompresji lub migracji. Kolejną cechą programu składującego dane jest zdolność do składowania i odzyskiwania dowolnie wybranych fragmentów systemu, włączając w to możliwość reagowania na atrybut Archive.

Sieć w ZAP S.A. Ostrów Wlkp. po modernizacji będzie pracować pod kontrolą systemu NetWare 5, dzięki czemu można wykorzystać istniejący w systemie wysokiej klasy program składujący SBACKUP spełniający powyższe wymogi, pozwalający w miarę posiadania odpowiednich driverów pracować z dużą ilością różnych streamerów i innych urządzeń pamięciowych. SBACKUP pracuje na serwerze jako moduł ładowalny a unikalną zaletą jego jest zdolność do składowania w zasadzie dowolnych zasobów sieci, czyli nie tylko danych serwera, na których jest zainstalowany, ale również innych serwerów 3.x lub 4.x dostępnych w sieci, a nawet dysków lokalnych stacji roboczych DOS lub OS/2. Program ten bazuje na uniwersalnym systemie usług gromadzenia danych o nazwie Storage Management Services (SMS). Sterownik do urządzenia składującego musi być załadowany na serwerze jako moduł ładowalny, a samo urządzenie przyłączone do serwera.

Wyróżniamy następujące strategie kopiowania:

  • pełna – kopia wszystkich danych jest najprostszą i najbezpieczniejszą,
  • różnicowa – polega na składowaniu w kolejne dni tylko różnic w stosunku do ostatniego pełnego składowania danych,
  • przyrostowa – polega na składowaniu w kolejne dni zmienionych i nowych danych
    w stosunku do ostatniej kopii.

Wykonywanie kopii zapasowej musi być ustalone i egzekwowane bez żadnych wyjątków. Należy rotacyjnie używać kompletu nośników (taśmy, dyski optyczne itp. ) kopii zapasowej obejmujących pewien okres czasu. Ten okres nazywa się oknem kopii zapasowej i zależnie od konkretnych wymagań oraz ilości danych może obejmować okres od 2 do 4 tygodni.

Biorąc pod uwagę ilość danych przetwarzanych w sieci zakładowej ZAP S.A. Ostrów Wlkp. cykl wykonywania kopii zapasowej powinien trwać trzy tygodnie (cykl ten określa się jako: Syn, Ojciec, Dziadek). Tworzone są trzy pokolenia kopii, każde odpowiadające jednemu tygodniowi pracy. W przypadku wykonywania kopii na taśmach magnetycznych, każdy dzień w całym cyklu to inna taśma (tak samo w przypadku innych nośników). Pierwszego dnia jest tworzona pełna kopia zapasowa wszystkich danych w sieci. Tak powstaje taśma Syna.

W kolejnych dniach tygodnia są kopiowane tylko pliki, które zmieniły się od czasu wykonania poprzedniej kopii i nadany im został atrybut Archive oraz nowe pliki danych (kopia przyrostowa). W pierwszy dzień drugiego tygodnia jest tworzona następna pełna kopia wszystkich danych a w następne dni tygodnia podobnie jak w pierwszym tygodniu tylko kopie przyrostowe. W czasie drugiego tygodnia taśmy Syna stają się taśmami Ojca, natomiast taśmy zawierające kopie z drugiego tygodnia stają się taśmami Syna. Trzeci tydzień podobnie jak pierwszy i drugi rozpoczyna się od pełnej kopii a następne dni tylko kopie przyrostowe. Zestaw taśm Ojca przechodzi teraz w zestaw Dziadka, taśmy Syna stają się taśmami Ojca a nowe taśmy tworzą komplet Syna. Cały cykl wymaga użycia 21 taśm. Po pełnym cyklu rozpoczyna się nowy cykl zapisywany na taśmach z poprzedniego cyklu. Taśmy Dziadka są powtórnie używane i stają się taśmami Syna.

Należy wykonywać dwie kopie zapasowe: jedna powinna zostać w siedzibie firmy, a drugą należy przechowywać w bezpiecznym miejscu poza firmą. Jeśli wykonujemy tylko jedną kopię należy ją przechowywać w miejscu zabezpieczonym przed kradzieżą i przypadkami losowymi np. ognio i wodoodpornej szafie pancernej. Niestety nie jest to najlepsze rozwiązanie ponieważ w czasie pożaru nawet jeśli kopie nie spłoną to wysoka temperatura może je nieodwracalnie uszkodzić.

Archiwizacja danych – oznaczać będzie składowanie informacji w elektronicznym archiwum, w celu jej przechowania przez wymagany czas. Trwała archiwizacja oznacza więc gromadzenie różnego rodzaju danych na trwałych nośnikach, które są później składowane w archiwach i niejednokrotnie przechowywane przez długie lata. Dotychczas taką archiwizację przeprowadzano na taśmach magnetycznych, których głównymi wadami były długi czas odszukania potrzebnej informacji, niska trwałość nośników i ich wrażliwość na różne „przeciwności losu” oraz wysoki koszt magazynowania danych. Współczesne technologie otwierają nowe możliwości dla systemów trwałej archiwizacji. Istnieją bowiem nośniki charakteryzujące się bardzo wysoką trwałością, odpornością na czynniki zewnętrzne i dużą pojemnością.

Duże archiwum zajmuje więc mało miejsca. Takim nośnikiem jest wszechobecny dysk CD lub CD-R. Dodatkowo nośniki CD i CD-R posiadają cechę predysponującą je do zastosowań finasowo-księgowych: są zgodne z ustawą o rachunkowości (raz zapisane dane są niemodyfikowalne a zabezpieczenie płyty przed zapisem jest gwarancją ostatecznej wersji danych). Archiwizując, kopiuje się pliki do pamięci masowej (CD-R) a następnie usuwa z serwera odzyskując tym samym przestrzeń dyskową. Wybór plików do archiwizacji dokonuje się zwykle według kryterium wykorzystania pliku. Archiwizowane są tylko pliki nie używane przez określony czas. W sieci zakładowej ZAP S.A. Ostrów Wlkp. należy archiwizować dane nie używane przez okres pół roku oraz przed zmianą wersji oprogramowania. Okres półroczny nie dotyczy danych księgowych, które należy archiwizować po zamknięciu roku obrachunkowego.

Sprawdzenie czy dany plik był używany, wiąże się z badaniem znacznika czasu utworzenia lub ostatniej modyfikacji, który przypisany jest każdemu plikowi. Przy modyfikowaniu pliku odpowiadający mu znacznik czasu jest zmieniany i wskazuje datę i godzinę zapisania zmienionego pliku. Administrator sieci może sprawdzić daty plików „ręcznie”, ale jest to czasochłonne i uciążliwe. Lepszym rozwiązaniem jest wykorzystanie możliwości programów archiwizujących, które mogą automatycznie sprawdzać znaczniki czasu plików, po czym archiwizują, indeksują i usuwają pliki spełniające zdefiniowane kryteria.