Una nuova ricerca rivela sfide e opportunità nell’utilizzo dello streaming dei dati per l’intelligenza artificiale

governance dell'IA - intelligenza artificiale - data streaming

Oltre quattro aziende su dieci stanno già utilizzando il data streaming per addestrare o eseguire modelli di intelligenza artificiale, secondo quanto emerge da un nuovo studio. Tuttavia, l’implementazione di questa tecnologia non è priva di ostacoli significativi.

Gli intervistati hanno individuato nell’integrazione con sistemi di AI e machine learning la capacità più importante che un sistema di data streaming dovrebbe possedere, superando per rilevanza i “connettori per applicazioni mainstream” e gli aspetti legati a “sicurezza e governance”.

Le Sfide dell’Implementazione

Le grandi organizzazioni stanno affrontando una vasta gamma di criticità quando utilizzano il data streaming per addestrare o eseguire sistemi di intelligenza artificiale. I problemi spaziano dalla ricerca del talento giusto al reperimento di fondi per l’hub centrale di streaming dei dati e AI.

Lo studio realizzato da Conduktor, condotto su 200 dirigenti senior nel settore IT e dei dati presso grandi aziende con un fatturato annuo di almeno 50 milioni di dollari, ha rivelato dati interessanti: più di quattro intervistati su dieci (43%) hanno dichiarato di utilizzare già il data streaming per l’addestramento o l’esecuzione di AI, rispetto all’83% che lo impiega per automatizzare i flussi di lavoro e al 51% che lo utilizza per decisioni in tempo reale.

I Problemi di Qualità dei Dati

Le tre principali problematiche di qualità segnalate dagli intervistati sono state: formati o schemi di dati incoerenti, eventi duplicati che causano output distorti dell’AI e dati mancanti o incompleti.

Ulteriori complicazioni emergono quando le organizzazioni tentano di espandere l’infrastruttura dei dati per supportare iniziative AI più approfondite. Le sfide più rilevanti in questo senso includono preoccupazioni relative alla privacy e sicurezza dei dati (citate dal 72% degli intervistati), costi elevati dell’infrastruttura (59%) e mancanza di capacità di elaborazione in tempo reale (58%).

Gli Strumenti Più Utilizzati

Gli intervistati hanno riferito di utilizzare una gamma di strumenti AI per la preparazione dei dati, l’addestramento e l’inferenza. I quattro più popolari sono stati: Google Cloud Vertex AI, Microsoft Azure Machine Learning, Amazon SageMaker Data Wrangler e AWS Glue DataBrew.

Fiducia Nonostante le Difficoltà

Nonostante i punti critici evidenziati dalla ricerca, gli intervistati si sono mostrati in gran parte positivi riguardo all’utilizzo del data streaming per supportare le iniziative di intelligenza artificiale.

La maggioranza degli intervistati (80%) ha valutato il livello attuale di integrazione delle proprie piattaforme di data streaming con le piattaforme AI e ML come “buono”, mentre il 9% lo ha definito “eccellente” e l’11% lo ha giudicato “nella media”.

Questi dati suggeriscono che, nonostante le sfide tecniche e organizzative, le aziende riconoscono il valore strategico del data streaming nelle loro implementazioni di intelligenza artificiale e rimangono ottimiste sulle prospettive future.