Cuprins:
În ciuda eforturilor noastre cele mai mari de a le evita, incidentele IT reprezintă o parte inevitabilă a locului de muncă - și încercarea de a rămâne în fața perioadei de dezactivare cu impact asupra afacerii este doar mai dificilă. Sistemele de astăzi sunt strâns cuplate și din ce în ce mai complexe și cu piese în mișcare vin mai multe oportunități pentru ca lucrurile să nu funcționeze.
Acesta este un motiv pentru care din ce în ce mai multe organizații apelează la microservicii pentru o disponibilitate crescută a serviciilor și o mai bună rezistență la eșec. Dar, deși acestea sunt premise foarte bune pentru ruperea aplicațiilor monolitice, ele pot, de asemenea, să compenseze riscul eșecului - cu excepția cazului în care sunt concepute în mod expres cu reziliență.
Pregătirea pentru eșec
Având în vedere natura inerent haotică a sistemelor distribuite, serviciile ar trebui dezvoltate nu numai pentru a anticipa eșecul, ci pentru a se recupera automat în caz de eșec. Acest lucru înseamnă instigarea eșecurilor în mod regulat pentru a vă asigura că sistemele dvs. pot gestiona haosul fără a întrerupe serviciile clienților finali. Pentru a realiza acest lucru, aveți nevoie de capacitatea de a simula traficul asemănător producției în mediile de testare.