|
Även outsourcing och
molntjänster kan gå snett
2012-01-12
I november 2011 drabbades Tieto Enator av datafel
som förmodligen fick konsekvenser för dem själva och
för ett flertal av deras kunder, bl.a. Apoteket,
SBAB och Bilprovningen.
Vad var det som hände och hur kunde det hända?
Det första som kanske slår en är att det förmodligen
förhåller sig så att deras kunder uppenbarligen inte
har varit riktigt medvetna om vad de har köpt för
"paket" med tjänster och program.
Stora serverhallar med massor av datorer som
residerar mängder av virtuella servrar och till
detta även separata disksystem och inbyggd redundans
imponerar men utgör samtidigt oerhört komplexa
system och därmed sårbara system.
Vad som egentligen hände hos Tieto Enator kan man
bara spekulera om, men eftersom det tog så lång tid
att få igång alla kunders system igen kan man anta
att redundanssystemen inte fungerade som det var
tänkt, eftersom då sådana system fungerar är allt
normalt uppe och snurrar igen inom ett till två dygn
i alla fall. Eftersom själva informationen, datat,
är det mest värdefulla och mest kritiska i ett
system är det logiskt att anta att avancerade
disksystem och backupsystem blev svåra att hantera
som det var tänkt.
Novell Inc. var pionjär var inom området då de 1986
lanserade Disk Mirroring och Disk Duplexing som en
standardfunktion i Novell NetWare. All data som
skrevs på original- eller primärdisken, speglades
över till en sekundär- eller spegeldisk och hade man
Disk Duplexing, som innebar 2 st diskkontrollerkort,
skedde detta i realtid. Data Construction som vid
den här tiden var Generalagent för Novell Inc.,
lanserade några år senare en produkt som hette VINCA,
som innebar att man kunde spegla hela filhanteraren
i realtid. Primärserver och sekundärserver var då
förbundna med en eller två fiberkablar för snabbare
och säkrare dataöverföring och för att klara långa
avstånd. Servrarna skulle hels stå i olika byggnader
i händelse av brand, sabotage eller annat elände som
skulle kunna tänkas äventyra driften och
fiberkablarna drogs på olika ställen likaså.
I samma veva lanserades också avancerade disksystem,
sk. RAID-system på marknaden som byggde på iden om
att om en fysisk disk i ett RAID-kabinett gick
sönder så kunde alla andra diskar i kabinettet ta
över och dessutom återskapa all förlorad data så
fort en ny disk monterades igen så att
RAID-kabinettet blev intakt igen och redo för en ny
ev. diskkrasch. Ett diskbyte kunde ofta ske under
pågående drift, vilket gjorde dessa system oerhört
populära och det faktum att diskar vid den här tiden
var extremt dyra gjorde inte saken sämre. Faktum är
att RAID togs fram just pga av att diskar då var så
väldigt dyra så istället för att ha dubbelt upp av
diskar kunde man trolla bort detta behov med hjälp
av RAID. I ett kabinett med 5 diskar t.ex. så var
nettoutnyttjandet 4 diskar. En extra disk gjorde
således att vilken som helst av de 5 diskarna som
gick sönder kunde denna återskapas med hjälp av de 4
övriga diskarna.
Problemet med lösning var att då det blev något knas
med kontrollerkortet så blev all data korrupt och i
RAID-systemen blev det soppa av allt på alla
diskarna i kabinettet om kontrollerkortet började
spöka.
Lägg sedan till att man idag har virtuella servrar
som pekar på/använder sig av olika Diskservrar som i
sin tur kan ha varianter av RAID-system, så förstår
man hur otroligt svårt det kan bli att bringa
klarhet i hur allt skall kunna återställas då något
(som man inte tror skall kunna hända) händer.
Allt det här betyder och pekar återigen på en enda
sak nämligen den att man alltid måste ha en
generationsbackup, helst en klonad kopia, kanske
kompletterad med påbyggnad av ett antal
inkrementella backuper innan man ånyo gör en
totalbackup/cloning med nya inkrementella backuper.
Det ska i sammanhanget framhållas att Tieto Enator i
sammanhanget inte är det enda serviceföretag som kan
råka ut för långa driftstopp, men det finns
förmodligen en viss skillnad i medvetandegrad och
förståelse för vad som kan inträffa hos
professionella aktörer och detta avspeglar sig med
all säkerhet i de avtal som skrivs med deras
respektive kunder. M.a.o. får en kund förmodligen
skylla sig själv som inte själv hade en aktuell
generationsbackup, eller hade köpt detta som en
tilläggstjänst.
Allt det som sagts ovan blir nu högaktuellt att
beakta då företag väljer att köra molntjänster hos
olika aktörer. Det gäller alltså att göra en
ordentlig kostnads- och RISK-analys och att noggrant
läsa igenom och förstå avtalstexterna med den aktör
man väljer. Här borde faktiskt ett stort ansvar
ligga hos IT-avdelningen, men frågan är om
IT-avdelningen ens blir involverad då tjänster väljs
och då avtal skall skrivas. Hos många företag
upplevs nämligen dylika val som "företagsstrategiska
frågor" som behandlas i styrelserummet och inte hos
teknikorienterade människor på IT-avdelningen.
-Hoppas att människor har blivit klokare idag.
//Roffe
|