Per interagire con l’AI gli utenti preferiscono la voce, ma la tecnologia deve essere all’altezza

AI generativa - voce

L’intelligenza artificiale generativa è uno dei rami più affascinanti e in rapido sviluppo dell’IA, capace di creare contenuti originali come testi, immagini, musica e persino video, ma soprattutto compiere una serie di attività impattanti che portano reale valore alle aziende, fattore questo ancora poco percepito.

Fino ad oggi i discorsi sull’intelligenza artificiale si sono concentrati principalmente sui suoi vantaggi teorici, come l’aumento dell’efficienza, l’ottimizzazione dei processi e la capacità di prendere decisioni basate su dati complessi. Nonostante questa comprovata consapevolezza dei benefici ottenibili, l’adozione dell’AI non è così elevata: sebbene l’80% delle aziende stia investendo in IA, la metà non è sicura di come utilizzarla. Inoltre mancano ancora casi di successo sufficienti per dimostrare come i benefici si traducano effettivamente in valore per le aziende. La sfida attuale è quindi quella di colmare questo divario con implementazioni efficaci e tangibili grazie ad una guideline strategica” ha spiegato Riccardo Brenna, Head of Research and Marketing Insights di Jabra, commentando i risultati estratti da uno studio condotto su un campione di 6000 utenti tra lavoratori e decision maker di tutto il mondo.

Dal report è emerso inoltre come la Voce rappresenti il modo migliore per poter utilizzare l’intelligenza artificiale generativa in quanto più veloce rispetto alla scrittura dei comandi (a voce si possono pronunciare tra le 200 e le 300 parole al minuto, mentre digitando su un computer o uno smartphone soltanto tra le 40 e le 70), più naturale e meno faticoso.

Esiste però una problematica: l’intelligenza artificiale mediamente capisce correttamente solo 1 parola su 3 creando problemi non poco indifferenti.

Basti pensare ad una riunione registrata e trascritta tramite un sistema basato sull’AI dove le parole vengono inserite in modo errato e senza capire quando parlano persone diverse, magari con accenti differenti. Peggio ancora se tutto questo avviene in contesti particolarmente rumorosi. Ne consegue quindi un report errato che può portare l’azienda a compiere errori anche piuttosto importanti.

La tecnologia di acquisizione della voce è sempre più determinante e lo sarà ancora di più in futuro quando molto probabilmente le interazioni con l’AI avverranno soprattutto in maniera vocale. Per questo le soluzioni Jabra offrono l’ottimizzazione della riduzione del rumore attivo e passivo così da permettere all’AI di svolgere al meglio il proprio lavoro” ha aggiunto Riccardo Brenna evidenziando come PanaCast 50, Speak2, Evolve 2 ed Engage siano state approvate da Force Technology per l’accuratezza di trascrizione in ambienti rumorosi.