Big Data: la visione di Cloudera

Con l’irrompere dei Big Data sul panorama internazionale le cose sono cambiate e stanno cambiando sempre di più con il passaggio dalla fase di evangelizzazione a quella di reale e concreta attuazione dei primi progetti. Per questo il data management e gli analytics stanno assumendo un ruolo di primo piano andando a diventare la base su cui le aziende costruiscono un vero e proprio vantaggio competitivo. Abbiamo parlato di questo con Michele Guglielmo, Regional Sales Director di Cloudera per l’Italia ed il Sud Europa, in carica da febbraio 2016.

I Big Data possono rappresentare una reale opportunità di business. Come sfruttarli per incrementare davvero la produttività e creare un vero vantaggio competitivo?

Cloudera, basandosi sulla sua esperienza maturata negli otto anni dalla fondazione, ha individuato quattro driver che guidano un progetto Big Data.

Il primo è la modernizzazione dell’architettura data warehouse classica che dovrebbe portare ad un abbattimento dei costi. Col crescere BigDataesponenziale del numero dei dati, strutturati e non strutturati, infatti le aziende devono effettuare degli investimenti molto forti per mantenerli in data warehouse classico, ma contemporaneamente nascono nuove esigenze di flessibilità e di velocità nell’elaborazione del dato. La nuova visione dell’architettura del data warehousing fa sì che attraverso l’uso di nuove fonti dati e l’innovazione e la velocità di elaborazione del dato stesso sia possibile appunto ridurre il costo rispetto al modello precedente.

Il secondo driver invece?

E’ relativo al business, ovvero la possibilità di sviluppare una conoscenza approfondita della clientela utilizzando dati provenienti da canali di accesso diversi e da comunicazioni diverse a disposizione dell’azienda. Il fatto che le informazioni relative ai clienti siano raccolte tramite diversi strumenti comporta allo stato attuale un loro trattamento come silos separati. Occorre invece mettere le aziende in una condizione tale da poterli mettere a fattor comune e correlarli in maniera adeguata, così da produrre una serie di informazioni che aiutano l’azienda ad essere più competitiva e a fidelizzare il cliente tramite un’analisi in real time di quelle che sono le tendenze.
Un esempio calzante è quello del retail dove il coordinamento tra le informazioni prodotte dall’ERP aziendale relative alla disponibilità a magazzino e la wish list dei clienti compilata sul sito internet può far capire se è il caso oppure no di fare una promozione, annullando o comunque riducendo notevolmente il rischio di perdere soldi. I Big Data permettono quindi una gestione più precisa e puntuale che dà vantaggi sia al cliente che all’azienda stessa. E proprio qui sta il terzo driver: nel miglioramento dei prodotti e dell’efficacia dei servizi offerti alla clientela per dare velocità su quello che è l’impatto diretto col cliente.

Il quarto punto?

Riguarda la sicurezza e la compliance, cioè la capacità di mitigare il rischio di frode e di truffe o di essere rispondenti alle nuove regolamentazioni politiche e alle compliance sempre più stringenti.
Si tratta di un tema molto caldo soprattutto perché le compliance sono un progetto never ending: cambiano nel tempo ed è necessario dotarsi degli strumenti più adeguati e flessibili per essere sempre rispondenti.

 big-dataI vantaggi, quindi, ci sono tutti. Ma le aziende se ne rendono effettivamente conto? Come percepiscono davvero i Big Data? Si stanno attrezzando e in che termini?

Le aziende stanno guardando ai Big Data come ad un vantaggio competitivo vero e proprio. Le prime ad attrezzarsi sono ovviamente le banche perché il tipo di vantaggio che ne derivano calza a pennello sulle loro esigenze. Ma non solo loro stanno investendo in maniera massiva. Anche il mondo del manufacturing e dei trasporti sta rispondendo in maniera positiva.
Le aziende quindi hanno ben chiaro il tipo di vantaggio che possono derivare dall’adozione di un progetto Big Data, ma occorre essere molto concreti.

In che senso?

In passato è capitato che ci si facesse prendere un po’ la mano dall’entusiasmo e dalla fantasia. Per ottenere dei risultati in maniera immediata non si è capito che il progetto Big Data è particolarmente complesso e che richiede soprattutto il coinvolgimento di tutti i dipartimenti e le funzioni aziendali. Tutti questi processi infatti vanno a toccare il business, l’It, la security, le HR e non si può pensare di dare avvio ad un progetto senza coinvolgere le varie funzioni. Occorre quindi andare a gestire la relazione con le varie funzioni aziendali per avere un risultato immediato e veloce che dimostri la bontà del progetto.

E la complessità del progetto Big Data si esaurisce in questo?

Bisogna tenere presenti anche le difficoltà tecniche perché devono esserci una serie di elementi che aiutino ad elaborare il dato, non ultimo il discorso di avere l’allineamento classico processo, persone e tool. Questi tre elementi devono essere allineati, pena il rischio di fallimento del progetto.
Sul panorama Big Data, se vogliamo vedere l’ecosistema Hadoop, mentre fino a qualche anno fa avevamo cinque o sei progetti, oggi ne abbiamo raggiunti più di una ventina. Abbiamo una serie di applicazioni che insistono su Hadoop e che consentono di avere risultati completamente diversi. Si pensi ad esempio a Spark: nuove tecnologie e applicazioni che consentono di avere una visibilità sul dato completamente diversa rispetto a quella che avevamo qualche anno fa.

A proposito di Hadoop: Apache Hadoop compie 10 anni. E’ ancora attuale oggi il ruolo del software libero in questo hadoopscenario?

Assolutamente sì. La base di lavoro è proprio quella dell’Open Source. La nostra soluzione principe, Cloudera Enterprise, si basa infatti su Hadoop. Cloudera è un’azienda che vende delle sottoscrizioni perché abbiamo capito che dal punto di vista enterprise ci sono esigenze specifiche rispondenti a tematiche di security, di compliance, e soprattutto di governo della struttura software. Noi garantiamo al cliente una serie di servizi a supporto mediante la sottoscrizione di licenze che prevedono non solo la parte open source ma anche una parte di software proprietario, che sono i tool Cloudera Navigator – dedicato a mondo security ed encryption del dato – piuttosto che Cloudera Manager e Cloudera Director, che consentono di gestire un ambiente complesso di Big Data Hadoop.

Quindi la base di lavoro è importante che rimanga open source, dove noi investiamo tantissimo (siamo l’azienda con il maggior numero di committers sul mondo open source). Poi ogni azienda potrà valutare se andare su una soluzione open source supportata piuttosto che rimanere open source, ma questa è una scelta dell’utente.

 

Addentriamoci di più nell’offerta di Cloudera…

LOGO CLOUDERAOltre alle licenze di cui abbiamo già parlato (relative al mondo open source e al mondo software proprietario affiancato al mondo open source) Cloudera offre una serie di professional services che spesso eroghiamo attraverso i nostri partner, dove abbiamo una grande componente di relazione sia con partner locali sia con importanti system integrator.

A proposito di partner… di che numerica stiamo parlando?

I partner Cloudera sono catalogati in tre segmenti diversi. I Local Partner sono quelli che hanno accesso alla nostra piattaforma. Basta che si iscrivano sul sito web e diventano Bronze Partner con la possibilità di accedere a tutta la documentazione. Poi ci sono i Silver Partner, una decina di aziende selezionate in Italia, che raggiungono un certo livello di certificazione per poter erogare i nostri servizi e sono considerati la nostra mano lunga direttamente sul mercato.
Poi abbiamo gli hardware vendor e i software vendor, tra cui ad esempio Oracle, Hp e Dell, e poi i grandi system integrator tra cui Accenture e Deloitte.
Una delle nostre forze è quella di avere delle partnership molto estese con un canale di relazione e di partnership tra i più ampi in assoluto a livello mondiale su Hadoop.
Per cui oggi abbiamo partnership con circa 2.300 aziende diverse sia per quanto riguarda la vendita e l’erogazione di servizi, sia per quanto riguarda lo sfruttamento del dato che è in Hadoop.

I vostri clienti in quali settori verticali sono maggiormente presenti?

Finance e Telco, ma stiamo iniziando ad avere una serie di progetti importanti anche in ambito IoT.

Qual è la strategia di Cloudera in Italia?

L’Italia è un Paese importante nella strategia di Cloudera in cui abbiamo deciso di investire molto. Da due persone da cui era composto il team a febbraio siamo passati a sei e a partire da settembre ci sarà un nuovo innesto su Roma. L’idea è quella di crescere molto velocemente perché il mercato si trova in una fase di espansione vorticosa. Una presenza diretta sul territorio, d’altronde, è sempre più strategica perché in ambito Big Data si è passati da una fase di evangelizzazione a una di attuazione concreta dei progetti.

Prima parlavamo dei settori Telco e Finance, due settori dove i Big Data hanno trovato terreno fertile. Quali sono qui le opportunità e le sfide?

Parlerei sempre dei quattro punti che abbiamo introdotto all’inizio, tenendo conto delle peculiarità dei due settori. Nel mondo Finance il business si sta evolvendo con l’ingresso sul mercato di tutta una serie di strumenti resi disponibili con l’affermarsi del web. I competitor delle banche non sono più le banche ma Amazon, PayPal e così via. Quindi la sfida per gli istituti bancari è quella di confrontarsi con questi nuovi strumenti a disposizione della clientela.

Dalla parte Telco invece si assiste a una riduzione dei margini del business tradizionale, quello voce e dati. E la necessità è quella di trovare nuove fonti e risorse disponibili. Il mondo Telco in realtà è quello che raccoglie la maggior parte dei dati che produciamo al telefono e con sicurezza-informaticainternet e così via, quindi potrebbe esserci una flessibilità nei confronti dei clienti terzi che potrebbero essere interessati ad utilizzare determinati dati che possono essere sfruttati per interessi di business diversi da quelli che fino a qualche anno fa potevano riguardare una Telco.

Un altro ambito su cui vi state focalizzando molto è la sicurezza…

Sì, abbiamo tutta una serie di progetti molto importanti in ambito sicurezza. Il mondo di Hadoop è complementare agli strumenti che le aziende hanno a disposizione per la security per dare una visibilità più ampia su quello che sta succedendo all’interno e all’esterno dell’azienda. Per dare risposta alla crescente richiesta di utilizzare una maggiore quantità di dati, è nato il progetto ONI (Open Network Insight) di Intel e sempre da questa necessità è nata la Cyber Intelligence Platform firmata da Accenture (ACIP) o ancora la Open Source Adaptive Security (OSAS) di Cloudwick. Tutti progetti che utilizzano Cloudera come piattaforma Big Data.

Altra cosa che stiamo spingendo in partnership con Securonix è la User Behaviour Analytics ossia la possibilità di sfruttare tutte le informazioni degli utenti interni e esterni per capire qual è il comportamento degli utenti, con particolare riguardo a quelli interni, valutando poi le variazioni di comportamenti rispetto a uno standard calcolato on the fly.

Parlando di Big Data torna in primo piano il tema della privacy. Come vede la nuova normativa europea approvata a dicembre e che entrerà a pieno regime nel 2018?

Il nuovo testo non ha cambiato moltissimo rispetto alla nostra precedente normativa italiana, che insieme a quella austriaca e tedesca, era già piuttosto stringente.
Quello che cambierà non sarà di grosso impatto sui nostri clienti perché noi abbiamo la possibilità di gestire il dato in modo flessibile e rispondente a qualunque data privacy dovrebbe uscire.privacy

A questo proposito vorrei sottolineare come Cloudera con Mastercard è stata nominata una delle pochissime soluzioni sul mercato certificate compliance PCI: un vero e proprio fiore all’occhiello che ci consente di avere una sicurezza intrinseca che consente al cliente di star tranquillo per quanto riguarda la gestione del dato in generale.

In chiusura: altre novità sul fronte Cloudera?

La novità più grande sta nella partnership molto forte che abbiamo con Intel, a seguito dell’acquisizione del 18% del nostro capitale nel 2015 per 740 milioni di dollari, che porterà a breve alla creazione di una serie di nuove evoluzioni sui processori Intel soprattutto in ambito Big Data. Ad esempio, tra qualche mese sarà possibile fare l’encryption dei dati direttamente a livello di chip: chi sceglierà un ambiente a base Intel con Cloudera avrà dei vantaggi in termini di performance molto importanti rispetto ad altre soluzioni.