Što se dogodilo s novim globalnim prekidom rada Cloudflarea?

  • Cloudflare je pretrpio još jedan globalni prekid rada koji je utjecao na web stranice i usluge diljem svijeta, s posebnim utjecajem na Europu i Španjolsku.
  • Prekid rada usredotočio se na upravljačku ploču i API-je, generirajući 500 pogrešaka i nedostupne stranice u bankarstvu, videoigrama, društvenim mrežama i radnim alatima.
  • Incident se dogodio samo nekoliko dana nakon još jednog velikog prekida rada Cloudflarea, ponovno otvarajući raspravu o oslanjanju na nekoliko pružatelja infrastrukture.
  • Tvrtka tvrdi da je implementirala rješenje i prati sustav, iako i dalje postoje zabrinutosti oko pouzdanosti globalnog oblaka.

Globalni prekid rada Cloudflarea

Una Novi veliki prekid rada Cloudflare mreže Oluja je ponovno zaustavila internet ovog petka ujutro, uzrokujući probleme s pristupom svim vrstama web stranica i aplikacija u brojnim zemljama. U Španjolskoj i ostatku kontinentalne Europe, prvi znakovi počeli su se pojavljivati ​​sredinom jutra, kada su mnogi korisnici naišli na stranice koje se nisu učitale ili su vraćale poruke o pogrešci.

Američka tvrtka, koja djeluje kao ključna komponenta u sigurnosti i distribuciji sadržaja za milijune web-mjesta, potvrdio je da incident prvenstveno utječe na njegovu upravljačku ploču (kontrolna ploča) i API-je, iako se pravi doseg osjetio daleko izvan internih alata: dizajnerskih platformi, videopoziva, videoigara onlineDigitalno bankarstvo i široko korištene korporativne usluge bile su djelomično ili potpuno nedostupne veći dio jutra.

Greška u upravljačkoj ploči i API-jima uzrokuje ogromne pogreške

Incident s online uslugama Cloudflarea

po Službena stranica statusa CloudflareaProblem je nastao u kontrolna ploča i u sučeljima za programiranje aplikacija (API-jima) koje klijenti koriste za upravljanje konfiguracijama, sigurnosnim pravilima i naprednim uslugama. Kada te komponente zakažu, ne pate samo administrativni zadaci; mogu postojati i kaskadni učinci na same web stranice koje ovise o platformi.

Počevši od 08:56 UTC (09:56 u kontinentalnoj Španjolskoj), Cloudflare je počeo upozoravati da je istraživanje problema u upravljačkoj ploči i povezanim API-jimaNekoliko minuta kasnije, u 09:09 UTC, tvrtka je još uvijek istraživala i ubrzo nakon toga objavila da Ispravak je već bio primijenjen, ulaskom u fazu pomnog praćenja kako bi se provjerilo je li lijek bio učinkovit.

U međuvremenu, u praksi su tisuće web stranica počele prikazivati ​​greške poput "500 Interna pogreška poslužitelja" ili "Loš pristupnik"kao i prazne stranice i beskonačna vremena učitavanja. Za provjeru latencije tijekom prekida rada, korisno je konzultirati vodič na Kako izmjeriti ping u sustavu Windows 11Za mnoge korisnike, osjećaj je bio isti: od banaka online Čak su i njihovi uobičajeni radni alati, značajan dio njihovog digitalnog života, zamrznuti na nekoliko sati.

Sam Cloudflare priznaje da kupci koji intenzivno koriste kontrolna ploča i API-ji mogu vidjeti neuspjeli zahtjevi, nedostajući podaci ili nepotpuni odgovoriIako tvrtka inzistira na tome da njezina mreža za isporuku sadržaja (CDN) i sigurnosni sloj koji štiti web-stranice na rubu mreže još uvijek rade, istina je da je iskustvo za krajnje korisnike bilo vrlo drugačije, s raširenim prekidima u uslugama koje ovise o njezinoj infrastrukturi.

Utjecaj u Španjolskoj i Europi: od digitalnog bankarstva do videoigara online

Utjecaj prekida rada Cloudflarea u Europi

Posljedice pada snažno su se osjetile u Španjolska i ostatak Europegdje se velik dio jutarnjeg rada i slobodnih aktivnosti oslanja na usluge distribuirane putem Cloudflarea. Alati su sveprisutni u svakodnevnom životu kao što su Canva ili Zoom Imali su ozbiljnih problema s pristupom, što je otežalo rad na daljinu i virtualne sastanke u tvrtkama i obrazovnim centrima.

U području zabave, korisnici igra online kao što su Fortnite, Valorant, League of Legends A Epic Games Store je prijavio greške u povezivanju, beskrajne ekrane za učitavanje ili jednostavno nemogućnost prijave. U nekim slučajevima, problem je rezultirao izbacivanjem igrača iz mečeva ili nemogućnošću nastavka tekućih sesija, što je posebno frustrirajuće za one koji imaju zakazane turnire ili rangirane mečeve.

  Es-upozorenje u Barceloni i gradskom području zbog bujičnih kiša i rizika od poplava

Ni financijski sektor nije pošteđen. Nekoliko subjekata koji posluju u Španjolskoj, kao što su CaixaBank ili BankinterVidjeli su prekide u radu svojih digitalnih kanala, pri čemu korisnici nisu mogli pristupiti svojim računima, vršiti transfere ili provjeravati transakcije. Iako su u nekim slučajevima prekidi bili povremeni i relativno kratki, osjećaj ranjivosti u bankarstvu online Ponovno je pokrenuto.

Portali poput DowndetectorTvrtke specijalizirane za praćenje incidenata koje prijavljuju korisnici u stvarnom vremenu pokazale su porast prijava od ranog jutra. Izvješća pokrivaju sve, od društvenih mreža i platformi za sadržaj do usluga plaćanja i korporativnih alata, potvrđujući da Prekid rada Cloudflarea imao je globalni doseg i u više gospodarskih sektora.

Ponekad postoje čak i stranice posvećene posebno praćenju prekida usluge. Imali su problema s učitavanjemTo pojačava ideju da problem nastaje u dijeljenoj infrastrukturi oblaka, a ne u izoliranom kvaru jedne ili druge specifične usluge. Kada je pogođen međusloj koji podržava veliki dio mrežnog prometa, učinci se vrlo brzo šire.

Podudarnost sa zadacima održavanja u podatkovnim centrima u Sjedinjenim Državama

Održavanje podatkovnog centra Cloudflare

Događaj se vremenski poklopio s planirani radovi održavanja od strane Cloudflarea u nekoliko svojih podatkovnih centara u Sjedinjenim Državama, posebno u Detroitu i Chicagu. Ove tehničke operacije, koje su se prema tvrtki odvijale između 07:00 i 13:00 UTC, mogle su rezultirati preusmjeravanjem prometa i povećanom latencijom za korisnike u pogođenim regijama.

Cloudflare je prethodno upozorio da će tijekom ovih razdoblja održavanja Neka mrežna sučelja mogu biti privremeno izvan upotrebeZbog toga su se korisnici s izravnim međusobnim vezama morali oslanjati na sustave automatskog prebacivanja ili alternativne rute. Međutim, tvrtka još nije potvrdila jesu li ovi radovi izravno povezani s današnjim globalnim prekidom ili se jednostavno radi o nesretnoj vremenskoj slučajnosti.

Ono što se čini jasnim jest da kombinacija zadataka održavanja i incident u središnjim službama kao što je kontrolna ploča i API-ji To je stvorilo posebno osjetljiv scenarij. Male konfiguracijske pogreške ili problemi u širenju promjena mogu imati puno veći učinak kada se podudaraju s preusmjeravanjem prometa i promjenama u topologiji mreže.

Na svom statusnom portalu, Cloudflare održava aktivne informacijske kanale za kupce i korisnike, s periodična upozorenja o razvoju kvaraTvrtka inzistira na tome da je "popravak već implementiran" i da je sustav "pod nadzorom", pa bi se, teoretski, situacija trebala postupno vratiti u normalu tijekom dana.

Međutim, na vrhuncu utjecaja, mnogi su se korisnici i dalje suočavali Stranice koje se ne bi učitale do kraja ili povremene poruke o pogrešciOvo nepravilno ponašanje obično je tipično kada se primjenjuje rješenje koje se još nije proširilo cijelom mrežom ili kada se različite regije svijeta ažuriraju različitim brzinama.

  Lažne procurele informacije o GTA 6 stvorene umjetnom inteligencijom zbunile su milijune

Ponovljeni padovi: sjena nedavnih neuspjeha

Ova epizoda ne dolazi u vakuumu. Manje od mjesec dana ranije, Studenoga 18Cloudflare je već pretrpio još jedan globalni prekid rada koji je ugasio široko korištene usluge poput X-a (prije poznatog kao Twitter), ChatGPT-a, Canve i raznih korporativnih i e-trgovinskih web stranica. Taj prekid trajao je oko četiri sata i izazvao je široku raspravu o pouzdanosti glavnih pružatelja usluga u oblaku.

Tom prilikom, sama tvrtka je objasnila da je problem nastao nakon promjena dozvola interne baze podatakaTa naizgled mala prilagodba uzrokovala je da sustav automatski stvori tisuće dodatnih unosa u datoteci koju koristi modul za upravljanje. robota, odgovoran za razlikovanje legitimnog korisničkog prometa od automatiziranih posjeta.

Kako je ta datoteka rasla, bila je udvostručavajući svoju veličinu sve dok ne premaši granicu koju softver može podnijeti odgovoran za usmjeravanje prometa. Rezultat je bio unutarnji kolaps koji je rezultirao s 500 pogrešaka, ekstremnom sporošću i porukama "izazova" koje traže otključavanje sigurnosnih izazova u izazovi.cloudflare.comDrugim riječima, riječ je o isključivo softverskom i konfiguracijskom kvaru, bez tragova vanjskih kibernetičkih napada.

Dužnosnici tvrtke, uključujući izvršnog direktora Matthewa Princea, opisali su problem u to vrijeme kao "unutarnja softverska greška" i tvrdili su da nema dokaza o zlonamjernoj aktivnosti. Međutim, činjenica da se dogodila u samo nekoliko tjedana Još jedan značajan neuspjeh koji milijune korisnika ponovno ostavlja bez usluge. To počinje izazivati ​​zabrinutost među poslovnim klijentima i javnom upravom.

Industrijski analitičari sugeriraju da, kada se dva ozbiljna incidenta dogode u tako kratkom vremenskom razdobljuRazumljivo je postaviti pitanje jesu li procesi osiguranja kvalitete, testiranja i implementacije promjena dovoljno rigorozni. Osim specifičnog tehničkog uzroka svakog prekida, zabrinutost se usredotočuje na to upravlja li Cloudflare adekvatno svojim rastućim teretom na globalnu internetsku infrastrukturu.

Ovisnost o oblaku i jedna točka kvara

Tijekom godina, Cloudflare je postao jedan od temelja modernog webaNjihove usluge CDN-a, sigurnosti, ublažavanja DDoS napada i optimizacije performansi prisutne su na otprilike 20% web stranica diljem svijeta, prema procjenama industrije. To znači da kada tvrtka naiđe na problem, učinak se gotovo trenutno pojačava.

Ovo nije izolirani slučaj. Posljednjih mjeseci zabilježeni su značajni incidenti i na drugim velikim cloud platformama kao što su AWS (Amazon Web Services) ili Microsoft AzureZbog tih prekida rada poslovne aplikacije, digitalnih usluga i kritičnih alata onemogućen je rad u nekoliko zemalja. Svaki od ovih kvarova dodatno naglašava ogromnu ovisnost o maloj skupini pružatelja usluga.

U praksi, za prosječnog korisnika, kada jedan od ovih divova ima loš dan, Čini se da je pola interneta prestalo raditiOd društvenih mreža do trgovina onlineOd generativnih AI usluga i platnih platformi do internih poslovnih sustava, sve se oslanja na infrastrukturu koja često prolazi nezapaženo dok ne zakaže.

  Appleova vrijednost dionica premašila je 4 bilijuna dolara: Evo kako su to učinili

Stručnjaci za infrastrukturu ističu da ova centralizacija podrazumijeva jedna točka kvara Za mnoge kritične usluge, jedna pogrešna konfiguracija, neispravno ažuriranje ili loše upravljani problem s mrežom mogu izazvati domino efekt. Ovaj rizik postaje posebno kritičan u sektorima poput bankarstva, digitalnih komunalnih usluga i online obrazovanja.

U Španjolskoj su glasovi iz tehnološkog i financijskog sektora već upozoravali da koncentracija toliko mnogo usluga u nekoliko oblaka To zahtijeva ponovno razmatranje strategija otpornosti, sigurnosnih kopija i planova za nepredviđene situacije. Dugotrajni prekid rada ne bi utjecao samo na svakodnevni život korisnika, već i na unutarnje poslovanje tvrtki i vladinih agencija.

Što se zna o odgovoru Cloudflarea i što korisnici mogu učiniti?

Za sada, Cloudflare kaže da implementirao je ispravak i održava intenzivan nadzor iz njihove mreže kako bi potvrdili da je incident u potpunosti riješen. Njihov statusni portal ažurira se porukama s detaljima o napretku istrage i statusu kontrolna ploča, API-je i ostale uključene usluge.

Tvrtka inzistira na tome Još nema službeno potvrđen uzrok Što se tiče današnjeg prekida rada, njihov tehnički tim nastavlja analizirati zapisnike, nedavne promjene i moguće interakcije s tekućim zadacima održavanja. Dok se ta analiza ne završi, neće se znati je li riječ o problemu sličnom onome od 18. studenog ili o kvaru drugačije prirode.

S korisničke točke gledišta, malo se toga može učiniti osim pričekajte da se usluge obnoveNeki stručnjaci preporučuju da se u tim slučajevima ne opsesivno osvježavate stranice ili prisiljavate kritične aplikacije na rad, budući da usred ozbiljnog incidenta odgovori sustava mogu biti nepredvidivi ili generirati dodatne pogreške.

Kao što je istaknuo DevOps menadžer s kojim smo se konzultirali prije nekoliko tjedana nakon prethodnog prekida rada, kada se pružatelj usluga ove vrste sruši, Naši uređaji postaju gotovo poput "utiskivača za papir". za mnoge svakodnevne zadatke: administrativne postupke, kupovinu, učenje, rad na daljinu, igranje igara online...sve, na ovaj ili onaj način, prolazi kroz podatkovne centre i mreže za distribuciju sadržaja.

U poslovnom svijetu, IT timovi često koriste planovi za nepredviđene situacije Ove mjere uključuju aktiviranje alternativne infrastrukture, promjene DNS-a, preusmjeravanje prometa ili čak degradirane načine usluge kako bi se održale barem bitne funkcije. Međutim, nemaju sve tvrtke resurse ili višeoblačne arhitekture koje im omogućuju brzu reakciju na prekide ovog opsega.

S obzirom na to da se usluge počinju oporavljati i da se aktivnosti polako vraćaju u normalu, ono što se danas dogodilo s Cloudflareom služi kao podsjetnik na u kojoj mjeri globalna mreža ovisi o nekolicini aktera i kako kvar u naizgled nevidljivom sloju može utjecati na svakodnevni život milijuna ljudi u samo nekoliko minuta.

Kako izmjeriti ping u sustavu Windows 11
Povezani članak:
Kako izmjeriti ping u sustavu Windows 11