Joe Baguley di Broadcom parla di resilienza organizzativa: cos’è, perché è fondamentale e da quali minacce deve difendersi

resilienza-organizzativa

Nell’articolo che segue, Joe Baguley, CTO EMEA di Broadcom, approfondisce il concetto di resilienza organizzativa, spiegandone il significato e l’importanza strategica.

La resilienza di un’azienda non si limita alla cybersicurezza, ma coinvolge una serie di fattori chiave che garantiscono la continuità operativa anche in scenari complessi. In questo contributo, Baguley analizza questi elementi e condivide la sua visione su come costruire un’organizzazione davvero resiliente.

Buona lettura!

Resilienza organizzativa: dobbiamo guardare oltre gli attacchi informatici

Cosa vi viene in mente quando pensate alla resilienza organizzativa? Per molti, si tratta di salvaguardare l’azienda da interruzioni come guasti ai sistemi fisici – come abbiamo visto di recente durante il blackout in Spagna – disastri naturali o minacce informatiche. In questo contesto, la cybersecurity tende spesso a essere al centro dell’attenzione. Secondo Deloitte, mentre l’88% dei responsabili aziendali considera la resilienza una priorità, solo il 39% ha una definizione chiara e condivisa di cosa significhi effettivamente resilienza per la propria organizzazione. È importante notare che la resilienza organizzativa non riguarda solo la prevenzione, ma anche la continuità operativa dopo i guasti ai sistemi.

Negli ultimi due decenni le strategie di resilienza hanno dovuto essere adattate al software anziché all’hardware. In molti casi, si è semplicemente cercato di applicare gli approcci tradizionali alle nuove tecnologie. Le strategie più comuni includono la ridondanza N+1 e 2N+1; nel primo caso, i carichi di lavoro vengono eseguiti su un sistema principale con un secondo come back-up; nel secondo, su due sistemi attivi con un terzo di riserva. Questo per eliminare i singoli punti di guasto e garantire la continuità operativa anche in caso di danni ai componenti dell’infrastruttura.

Tuttavia, negli ambienti di cloud ibrido è necessario un approccio più completo alla resilienza organizzativa, che comprenda una mappa completa di tutte le potenziali minacce. Questa è la direzione che le autorità competenti stanno prendendo di recente con un “approccio a tutti i rischi” in regolamenti come il Digital Operational Resilience Act (DORA) dell’UE (per il settore finanziario), la Network and Information Security Directive (NIS2) (per le infrastrutture critiche) e il Cyber Resilience Act (CRA) (per la sicurezza dei prodotti).

Concentriamoci prima sul cyber

La minaccia prioritaria contro cui oggi le aziende investono milioni per proteggersi è quella informatica. Con l’avvento dell’Intelligenza Artificiale, questa minaccia è diventata ancora più complessa: i sistemi basati su AI ampliano le superfici di attacco e introducono vettori di minaccia nuovi e più sofisticati, generando sfide di sicurezza senza precedenti. Inoltre, le infrastrutture dipendenti dall’AI richiedono solidi quadri di resilienza informatica che proteggano non solo i dati, ma anche l’integrità dei sistemi decisionali autonomi, che stanno diventando sempre più centrali con l’avanzare dell’AI agenziale.

Se questi sistemi sono costruiti in un ambiente di cloud ibrido, non si può sempre fare affidamento sul fornitore di cloud pubblico per garantire solide misure di sicurezza. È fondamentale assumere il controllo: ogni carico di lavoro eseguito deve incorporare resilienza a più livelli dell’architettura. L’importante è implementare una soluzione di difesa in profondità, che sia agnostica rispetto al carico di lavoro e alla soluzione cloud all’interno dell’infrastruttura tecnologica (pubblica o privata), fornendo al contempo un controllo centralizzato. Test di simulazione regolari sono importanti per verificare che la soluzione funzioni non solo in teoria, ma anche sotto stress reali. Questa non è più solo una best practice: in alcuni settori è un vero e proprio requisito normativo, come stabilito dal regolamento DORA (Digital Operational Resilience Act) e dalle relative Norme Tecniche di Regolamentazione (RTS).

Protezione da eventi globali e normative in evoluzione

Un altro aspetto cruciale della resilienza riguarda le forze esterne che vanno oltre i cyberattacchi. Viviamo in un contesto di crescente incertezza, in cui le tensioni geopolitiche influenzano profondamente il panorama tecnologico. Ad esempio, i conflitti globali non solo provocano instabilità territoriale, ma possono portare all’interruzione della supply chain e, in casi estremi, all’isolamento di intere aree. Le organizzazioni hanno bisogno di strategie che consentano di spostare i carichi di lavoro in modo rapido, senza vincoli di compliance. Inoltre, alcune componenti hardware possono diventare indisponibili con breve preavviso a causa dell’interruzione della supply chain.

Il panorama normativo globale continua a frammentarsi a livello locale. Come dimostra la recente imposizione di dazi commerciali, la divergenza normativa globale non solo può avere serie implicazioni in termini di costi, ma può richiedere un riassetto della struttura organizzativa per riflettere le aree su cui l’organizzazione si concentra. La resilienza organizzativa dovrebbe anche tenere conto di potenziali cambiamenti normativi futuri. Ad esempio, sebbene il regolamento DORA e le RTS che lo accompagnano siano in fase di elaborazione da anni, nulla vieta che una versione simile – adattata a contesti regionali o locali – venga introdotta in altri Paesi con tempi molto più rapidi. Per affrontare scenari di questo tipo, le organizzazioni devono implementare quadri solidi di valutazione del rischio digitale, definiti a livello locale o regionale, con strutture di governance chiare e capacità complete di risposta agli incidenti, in grado di documentare la conformità normativa in modo trasparente. In questo percorso, le soluzioni cloud sovrane possono offrire un supporto concreto, combinando innovazione continua e aderenza alle normative locali, e contribuendo a costruire una resilienza tecnologica e regolatoria più robusta.

Un esame interno

Esistono numerosi fattori interni che possono influire sulla resilienza operativa di un’organizzazione. Esaminate i vostri contratti tecnologici, ad esempio, e le condizioni e le clausole in essi contenute. I carichi di lavoro devono essere costruiti e gestiti in modo indipendente dalla piattaforma, per garantire la flessibilità e l’adattabilità dei sistemi, e si deve considerare l’importanza della portabilità per alcuni carichi di lavoro.

Anche l’aggiornamento continuo della forza lavoro è importante. Investire nello sviluppo di competenze complete crea resilienza organizzativa grazie a dipendenti con formazione trasversale che eliminano i singoli punti di errore e rispondono efficacemente alle diverse sfide. Questa strategia garantisce la sovrapposizione delle capacità dei team, favorisce l’adattabilità, migliora la risposta agli incidenti e sviluppa un’intelligenza collettiva che consente un recupero più rapido dalle interruzioni.

Quindi, che fare?

Costruire uno stack 2N+1 temprato e integrato o suddividerlo in due data center Tier 4 non è più sufficiente per le esigenze di resilienza di oggi e per alcuni settori potrebbe non essere nemmeno sufficiente dal punto di vista legale per rimanere conformi.

Una volta mappate le dipendenze, le organizzazioni devono rivolgersi a piattaforme che permettano la continuità operativa e il disaster recovery, consentendo loro la flessibilità di eseguire i carichi di lavoro critici su più ambienti cloud, privati, pubblici ed edge, con la possibilità di spostarsi rapidamente da uno all’altro in caso di necessità. I team IT devono anche assicurarsi che queste piattaforme abbiano funzionalità integrate di disaster recovery e failover, in modo che le applicazioni critiche rimangano disponibili anche in caso di interruzione dell’attività.

In sostanza, dopo aver documentato accuratamente le dipendenze dei sistemi, le organizzazioni devono integrare la resilienza nelle loro piattaforme e nelle loro architetture applicative, progettandole per operare senza problemi in ambienti diversi. Queste soluzioni devono consentire la transizione dei carichi di lavoro tra infrastrutture private, provider di cloud pubblici e postazioni periferiche senza interruzioni significative, evitando singoli punti di guasto che potrebbero compromettere le operazioni durante le interruzioni. Devono incorporare meccanismi di failover automatizzati che monitorano continuamente la salute del sistema e reindirizzano rapidamente l’elaborazione quando vengono rilevati problemi, con un intervento umano minimo. Laddove è necessario l’intervento umano, è importante circondarsi di partner che agiscano come un’estensione del team interno, fornendo consulenza e approfondimenti basati sull’esperienza.

Questo approccio globale alla resilienza, che combina ambienti informatici distribuiti con sistemi di ripristino automatizzati e intuitivi, consente alle organizzazioni di ottenere una vera continuità operativa che affronta sia le minacce alla sicurezza informatica che le interruzioni operative più ampie, consentendo al contempo un monitoraggio continuo.

di Joe Baguley, CTO EMEA, Broadcom