Hvorfor sliter mange store nettsteder med nedetid?

Et bilde av jordkloden med grafiske elementer som skal representere kommunikasjon
(Foto: Shutterstock/greenbutterfly)

Instagram, WhatsApp og Facebook var tre av en rekke nettsider og apper som har vært belemret med nedetid i 2021. Facebook sier at konfigurasjonsforandringer i backbone-ruterne, som koordinerer nettverkstrafikken mellom selskapets datasentre forårsaket problemer som forstyrret denne kommunikasjonen. Dette hadde ringvirkninger på måten datasenterne kommuniserte på, og førte til syvende og sist at selskapets tjenester gikk ned for telling.

Hendelsen understreker at globale stans i driften til store tjenester er et av de største aberne med et sentralisert system, og i en tid der mange store nettsteder og aktører fortsatt sliter med utfordringene med nok en omfattende driftsstans blir spørsmålet det følgende: Hva er det som forårsaker de stadige problemene med de store nettjenestene?

I en kommentar i tilknytning denne ukens nedetid, sa Matthew Hodgson, administrerende direktør for Element: «Sentraliserte apper betyr at alle eggene er i samme kurv. Når kurven ryker går alle eggene i bakken. Vi så det samme forrige uke, da Slack gikk ned for telling.»

«Desentraliserte systemer er langt mer pålitelige. Det er ikke ett enkelt bristepunkt, og dermed kan de tåle markante problemer, og fortsatt holde kommunikasjonen mellom folk og bedrifter oppe.»

«Dette er en av grunnene til at vi opplever en økning i selskaper som bruker Element og det desentraliserte Matrix-nettverket, særlig til virksomhetskritiske oppgaver.»

Noen av de største globale tjenestene, i tillegg til Facebook, Instagram og WhatsApp, som har opplevd perioder med nedetid i år, inkluderer nettsiden til eiendomsutleierne Airbnb, British Airways og underholdningsnettverket PlayStation Network, som senest opplevde problemer den 7. oktober.

Andre merkevarer som har hatt problemer med å holde seg på nett i år inkluderer UPS, Home Depot, Delta, HSBC, Capital One, GoDaddy, LastPass, AT&T, Costco og Vanguard, for å ta de virkelig store i internasjonal sammenheng. Disse nettsidene hadde problemer med trege lastetider, og at kundene ble servert følgende beskjed: «Service Unavailable – DNS failure».

Her hjemme i Norge hadde NRK og VG store problemer, i forbindelse med problemer i Telias nettverk, for bare noen dager siden.

Brukere har i året som gått strømmet til nettstedet Downdetector, en tjeneste som har oversikt over nedetid på internett, for å rapportere om problemer med over 48 tjenester. Nettsiden viser kun hvorvidt problemer inntreffer, men forklarer ikke årsaken, så hva er det egentlig som foregår?

DNS

The Domain Name System (DNS) is a central part of the internet. (Image credit: Shutterstock/Funtap)

Hva er årsaken? 

Synderen som sto bak problemene denne gangen var en konfigurasjonsoppdatering hos skytjenestefirmaet Akamai Technologies, som fremprovoserte en programvarefeil i selskapets DNS (Domain Name System) – mekanismen som forteller nettlesere hvilken adresse telefonen eller datamaskinen din skal gå til når du surfer på nett.

DNS er som en slags telefonkatalog med oversikt over alle sidene på internett, og hvilke domenenavn de bruker. På nett kommuniserer datamaskiner ved hjelp av såkalte IP-adresser. Alle maskiner som er koplet på nett har sin egen unike adresse ut mot internett. DNS-servere har som jobb å oversette domenenavnene til IP-adresser (og omvendt), slik at nettlesere får vite hvilken IP-adresse de skal gå til når du skriver inn den vanlige tekstbaserte adressen i adressefeltet. I praksis gjør dette systemet sider på internett tilgjengelige for folk flest, som gjerne vil unngå å vite IP-adressene til alle sidene de vil besøke.

Akamai tok i bruk Twitter da de skulle klargjøre hva som faktisk skjedde da de store nettaktørene lå radbrukket, og sa at de klarte å reversere programvareoppdateringen, slik at tjenestene kunne gå tilbake til normal drift.

Gav Winter, administrerende direktør for nettsideytelse- og sikkerhetsfirmaet RapidSpike, sa, i en kommentar angående de seneste problemene: «Internett har nok en gang vist seg å være et uberegnelig sted, og det er Akamai som befinner seg i sentrum av problemene denne gangen, hvilket understreker behovet for uavhengige monitoreringsverktøy, snarere enn å putte alle eggene i en tjenestetilbyders kurv.»

«Ikke bare er noen av de største nettsidene nede, men nøkkeltjenester som passordhåndteringstjenesten LastPass er nede. Folk kan per nå ikke få tak i passordene sine, noe som er et enormt produktivitetsproblem, gitt at du ikke kan logge deg inn på systemene dine. Dette kan også være ganske så farlig innen for eksempel helsevesenet eller finanssektoren, hvis du ikke kan logge deg inn på et system med en gang.»

I tillegg til problemer med DNS og CDN-er, kan såkalte løsepengevirus-angrep også være svært farlige for nettsteder, og har også vært kimen til flere store tilfeller av driftsstans.

Mengden organisasjoner som rammes av skadevare som krypterer data via nettverket øker.

Mellom nettsider og forbrukerne ligger det en hel rekke instanser som lever sitt eget liv, hvilket til syvende og sist kan føre til at mange nettsteder eksponeres. Enkelte selskaper har opplevd at nettjenestene de tilbyr har ligget brakk i over tre uker, i kjølvannet av et løsepengevirus-angrep.

Stadig flere opplever nedetid

Nedetiden vi opplevde denne uken er bare en av mange i 2021. Forrige måned gikk Fastly, en av de største CDN-tjenestene, ned for telling. Årsaken var, nok en gang, en simpel programvarefeil, og resultatet ble enorme problemer som involverte hundrevis av verdens mest populære nettsider.

I motsetning til DNS-servere er CDN-tjenester et nettverk bestående av servere som står strategisk plassert over hele verden, der hver enkelt har det samme innholdet. Når en bruker skal på nett, for eksempel for å strømme eller å besøke et nettsted, så koples hen til nærmeste CDN for å laste ned innholdet, slik at hastigheten og responstiden forbedres.

Problemene hos Fastly endte opp med å dra ned nettsider som Amazon, eBay, Reddit, BBC, PayPal, Squarespace og Vimeo, for å nevne noen. TechRadar ble også rammet.

I mars 2019 opplevde nettgiganten Facebook en nedetid som varte i hele 14 timer. Fadesen skal skal ha kostet selskapet 90 millioner amerikanske dollar, ifølge CNN.

På Twitter har mang en samtale dreid seg rundt i hvilken grad tjenester på internett avhenger av CDN-er, og mange mener at det nåværende systemet kan gjøre at nettsteder står åpne for nettangrep.

Jake Moore, nettsikkerhetsspesialist hos ESET, kommenterte: «Når så mange nettsider skal presses gjennom et lite antall CDN-er, så blottlegger det skalaen det er snakk om innen internett-infrastruktur, og presset de opplever når det gjelder å motstå angrep eller nedetid.»

«Yrkesutøvere innen informasjonssikkerhet er velforberedte når det gjelder å forutse det uforutsette, men selv det minste feilsteg kan ha store konsekvenser. Simuleringer hjelper på presset i en virkelig situasjon, men selv med en plan i bakhånd ville det tatt lang tid å rekonfigurere feilen.»

Hvordan løser man problemene?

Ifølge en forskningsrapport publisert av Opengear mistet 38 % av amerikanske bedrifter mer enn én million dollar i løpet av de siste 12 månedene, som følge av nettverksproblemer. Rapporten avslørte også at 41 % av amerikanske selskaper mener at nettverksproblemer er det som har størst innvirkning på kundetilfredshet. Undersøkelsen målte at kostnadene knyttet til nedetid varierte mellom 300 000 og seks millioner dollar hos organisasjoner verden over.

Bruken av stabile CDN-er, driftsikre tilbydere av vertstjenester og investeringer i overvåkning av nettdriften er noen av tiltakene organisasjoner har implementert for å sikre at nedetid skal inntreffe så sjeldent som mulig.

«Organisasjoner og statlige organer må vurdere å implementere tiltake som tar sikte på å vurdere, stabilisere, forbedre og overvåke, slik at dette problemet ikke forårsaker flere problemer i fremtiden», sa Matthew McDermott, seniorkonsulent i det globale teknologikonsultentselskapet Access Partnership.

«Evalueringer trengs for å slå fast flaskehalsen i serveren [det er snakk om], så vil man måtte stabilisere problemet med implementeringen av raske løsninger, som vil mildne innvirkningen dette har på interessenter og brukere. Etter dette vil interessenter måtte forbedre det hele ved å forandre på og optimalisere serverkapabiliteten, for å forsikre at den møter behovene. Til slutt vil man måtte sette opp automatisk monitorering som forhindrer fremtidige problemer.»

Mye står på spill i det verden fortsetter å utvikle seg i retning et heldigitalt samfunn, særlig nå i kjølvannet av den globale pandemien. COVID-19-krisen fortsetter å akselerere utviklingen e-commerce-løsninger gjør i retning nye typer firmaer, kunder og produkter, hvilket gjør at selskaper i økende grad må ha en rekke sikkerhetsaspekter i mente, gitt at verdens nettsider kontinuerlig står i fare for å oppleve nedetid.

Abigail Opiah
B2B Editor - Web hosting & Website builders

Abigail is a B2B Editor that specializes in web hosting and website builder news, features and reviews at TechRadar Pro. She has been a B2B journalist for more than five years covering a wide range of topics in the technology sector from colocation and cloud to data centers and telecommunications. As a B2B web hosting and website builder editor, Abigail also writes how-to guides and deals for the sector, keeping up to date with the latest trends in the hosting industry. Abigail is also extremely keen on commissioning contributed content from experts in the web hosting and website builder field.