Viviamo in un mondo di dati ibridi. Negli ultimi dieci anni, la quantità di dati strutturati creati, acquisiti, copiati e consumati a livello globale è cresciuta da meno di 1 ZB nel 2011 a quasi 14 ZB nel 2020. Numeri impressionanti, che vengono ulteriormente superati dal volume di dati non strutturati, cloud e informazioni prodotte dalle macchine – altri 50 ZB.
In effetti, si prevede che la quantità totale di dati sarà quasi triplicata entro il 2025. La causa principale di questa crescita va ricercata in quelli ibridi, ovvero le enormi quantità di dati creati ovunque le aziende operino: in cloud, on-premise e sull’edge di rete. Solo una parte viene effettivamente archiviata e gestita, che gli analisti già nel 2020 stimavano compresa tra 4 e 6 ZB. È evidente che i dati ibridi rappresentano sia un’enorme opportunità che una sfida impegnativa. Per capitalizzarne il potenziale è necessario essere in grado di sfruttare il valore di tutte le informazioni, indipendentemente da dove si trovino.
Fidatevi delle statistiche
Cloudera ha condotto una ricerca sull’Enterprise Data Maturity su oltre 3.000 tra responsabili IT e di business scoprendo che il 40% delle organizzazioni sta attualmente utilizzando soluzioni ibride, ma principalmente on-premise, e che il 36% prevede di passare a soluzioni ibride multi-cloud nei prossimi 18 mesi. Lo stesso studio ha anche rivelato che l’89% dei responsabili IT concorda sul fatto che le organizzazioni che implementano un’architettura ibrida come parte della loro strategia sui dati otterranno un vantaggio competitivo.
Dove scorrono i dati, arrivano le idee
Cloudera si impegna a far ottenere a tutti informazioni in tempo reale da qualsiasi dato, in ogni ambiente cloud, per prendere decisioni rapide e informate che riducono il time to value. È necessario gestire e analizzare dati di tutti i tipi, compresi quelli macchina, strutturati e non, transazionali, ovunque. Cloudera permette di spaziare tra multi-cloud e on-premise con una piattaforma di dati realmente ibrida, cono analisi dei dati cloud-native per l’intero ciclo di vita delle informazioni – dall’ingestion del dato, alla sua trasformazione e utilizzo in moderni data warehouse, in modelli transazionali, in streaming, a disposizione dei data science e di algoritmi di machine learning – che sono portabili attraverso le infrastrutture. inoltre, consente analisi multifunzionali che possono essere scritte una volta ed eseguite ovunque.
Una strategia hybrid data-first per ottenere valore più rapidamente
Le aziende possono ora capitalizzare il valore di tutti i loro dati, offrendo una piattaforma ibrida per architetture di dati moderne con informazioni ovunque. Cloudera Data Platform (CDP) è progettata per soddisfare i requisiti critici delle moderne architetture di dati di oggi e di domani.
Si tratta di una piattaforma unificata con analisi dei dati portatili e interoperabili per l’intero ciclo di vita e gestione distribuita dei dati in esecuzione su cloud pubblici, on-premise e in prossimità. Sicurezza, governance, metadati, replica e automazione comuni consentono a CDP di operare come un sistema integrato.
Con l’evoluzione dei big data verso i dati cloud e ora verso quelli ibridi, per le aziende è diventato più complesso accedervi, utilizzarli e crearne valore. È qui che entrano in gioco le moderne architetture di dati come data lakehouse, data fabric e data mesh. Queste nuove architetture, raccomandate come componente fondamentale anche dagli analisti del settore, sono progettate per gestire automaticamente la complessità, in modo da liberare i team IT da questo compito. Un data fabric unificato, alimentato da Cloudera SDX, orchestra tutte le fonti di dati distribuite in modo intelligente e sicuro in modalità self-service. In questo modo si ha la possibilità di avere una visione unificata, affidabile e completa di tutti i dati.
Con il data lake aperto, Cloudera consente analisi multifunzionali su dati in streaming e archiviati in un object store cloud-native su più cloud e on-premise. L’azienda dà priorità all’apertura e all’interoperabilità, ed è per questo che sta lavorando nella community utilizzando Apache Iceberg come formato di tabella di nuova generazione per consentire ai clienti CDP di utilizzare lo strumento analitico di loro scelta con il lake.
Per le aziende che desiderano attivare un data mesh scalabile, che consenta di trattare i dati come un prodotto combinando elementi delle architetture data fabric e data lakehouse, Cloudera fornisce la capacità di possedere e servire prodotti di dati, tutto in modo costantemente protetto, governato e orchestrato su più cloud e on-premise.
Cloudera Data Platform segue molto da vicino le indicazioni fornite da Gartner nella sua Strategic Roadmap for Migrating Data Management to the Cloud [Pubblicata il 21 marzo 2022 – ID G00746011, Analisti: Robert Thanaraj, Adam Ronthal, Donald Feinberg]: “Il futuro ecosistema dei dati dovrebbe sfruttare componenti di gestione dei dati distribuiti, che possono essere eseguiti su più cloud e/o on-premise, ma che vengono trattati come un insieme coeso con un elevato grado di automazione. L’integrazione, i metadati e le funzionalità di governance uniscono i singoli componenti”.
Alimentare la crescita con rapidità e capacità di controllo
Il 90% dei senior business decision maker dichiara che la propria organizzazione avrebbe maggiori opportunità di guadagno se fosse in grado di gestire i propri dati in modo più efficace. Cloudera sta già vedendo i propri clienti utilizzare la CDP per abbracciare le moderne architetture di dati e capitalizzare il valore dei loro dati ibridi. Un buon esempio è quello che sta facendo HelloFresh. Si tratta di una grande azienda di kit alimentari, con una classica configurazione di gestione centralizzata dei dati che comprendeva un numero ridotto di fonti interne ed esterne. Si trattava di un classico approccio tradizionale alla gestione dei dati. Dopo un periodo di crescita straordinaria, l’azienda ha riconosciuto che i dati sarebbero diventati un asset strategico fondamentale, in grado di fornire un vantaggio competitivo. L’azienda ha collaborato con Cloudera per costruire una data mesh, per fornire prodotti di dati affidabili al resto dell’organizzazione. L’adozione di tale approccio ha fornito dati puliti e consolidati in tempo reale per un’implementazione del cloud più veloce del 30% e una maggiore fidelizzazione dei clienti.
Solo il 12% dei responsabili IT intervistati ha dichiarato che la propria organizzazione interagisce con tutte le fasi del processo del ciclo di vita, rivelando come le opportunità rimangano inutilizzate in termini di impiego dei dati da parte delle aziende. L’obiettivo di Cloudera è dare a tutte le aziende la possibilità di ottenere questi vantaggi per muoversi più velocemente in modo molto più semplice.
di Fabio Pascali, Regional Vice President Italy di Cloudera