Home Tecnologie Analytics Mitsubishi Electric presenta la tecnologia Scene-Aware Interaction

Mitsubishi Electric presenta la tecnologia Scene-Aware Interaction

-

Tempo di lettura: 3 minuti

Mitsubishi Electric ha sviluppato la tecnologia Scene-Aware Interaction che, prima al mondo, è in grado di creare un’interazione intuitiva ed estremamente naturale con gli esseri umani basandosi sulla capacità di analizzare le scene e di tradurre i dati di rilevamento multimodale in un linguaggio naturale. Nella nuova tecnologia, Scene-Aware Interaction, è integrata la tecnologia compatta di intelligenza artificiale (IA) proprietaria di Mitsubishi Electric, denominata Maisart che consente di analizzare i dati di rilevamento multimodale per creare un’interazione estremamente naturale e intuitiva con gli esseri umani mediante la generazione di un linguaggio naturale basato sul contesto.

La tecnologia riconosce gli oggetti e gli eventi contestuali basandosi su dati di rilevamento multimodale, ad esempio immagini e video acquisiti per mezzo di telecamere, informazioni audio registrate con microfoni e informazioni di localizzazione misurate tramite LiDAR. Per dare priorità alle diverse categorie di dati, Mitsubishi Electric ha sviluppato la tecnologia di fusione multimodale attenzionale (Attentional Multimodal Fusion), che è in grado di ponderare automaticamente i dati unimodali salienti per supportare la scelta delle parole appropriate per descrivere le scene con precisione. Per eseguire i test di benchmark basati su un set di test comune, la tecnologia di fusione multimodale attenzionale ha utilizzato dati audio e video e ha ottenuto un punteggio di valutazione della descrizione delle immagini basata sul consenso (CIDEr, Consensus-Based Image Description Evaluation) di 29 punti percentuali superiore rispetto a quello ottenuto con il solo utilizzo di informazioni visive. La combinazione realizzata da Mitsubishi Electric di fusione multimodale attenzionale e tecnologia di rilevamento delle scene con la generazione di un linguaggio naturale basato sul contesto, ha creato un potente sistema di interazione end-to-end di riconoscimento delle scene che permette un’interazione estremamente intuitiva con gli utenti nelle diverse situazioni.

La tecnologia Scene-Aware Interaction per il sistema di navigazione delle autovetture, un’applicazione mirata, fornisce ai conducenti una guida intuitiva del percorso. Ad esempio, invece di comunicare al conducente “svoltare a destra tra 50 m”, il sistema fornisce indicazioni basate sulle scene rilevate, ad esempio “svoltare a destra prima della buca delle lettere” oppure “seguire l’automobile grigia che svolta a destra”. Inoltre, il sistema genera avvisi vocali, ad esempio “un pedone attraversa la strada”, quando prevede che gli oggetti vicini possano intersecarsi con il percorso della vettura. Per questa funzionalità, il sistema analizza le scene e identifica i punti di riferimento visivi e distinguibili e gli elementi dinamici della scena, quindi utilizza gli oggetti e gli eventi riconosciuti per generare frasi intuitive per la guida.

I recenti progressi nel riconoscimento degli oggetti, nella descrizione dei video, nella generazione di linguaggio naturale e nelle tecnologie di dialogo vocale che si avvalgono delle reti neurali profonde, stanno permettendo alle macchine di comprendere meglio l’ambiente circostante e di interagire con gli esseri umani in modo più naturale e intuitivo. Si prevede che la tecnologia di interazione basata sul riconoscimento delle scene (Scene-Aware Interaction) sarà diffusamente applicata, ad esempio per le interfacce uomo-macchina, i sistemi di informazione e intrattenimento a bordo dei veicoli, l’interazione con i robot nei sistemi di costruzione e di automazione industriale, i sistemi di monitoraggio della salute e del benessere delle persone, i sistemi di sorveglianza che interpretano scene complesse per gli esseri umani e incoraggiano il distanziamento sociale, il supporto per funzionamento “touchless” delle attrezzature presenti nelle aree pubbliche, e molto altro ancora.

Redazione BitMAThttps://www.bitmat.it/
BitMAT Edizioni è una casa editrice che ha sede a Milano con una copertura a 360° per quanto riguarda la comunicazione rivolta agli specialisti dell'lnformation & Communication Technology.
  • Newsletter

    Iscriviti alla Newsletter per ricevere gli aggiornamenti dai portali di BitMAT Edizioni.

  • I più letti

    qboxmail_zoom

    Qboxmail si integra con Zoom

    Pianificare un video meeting, anche con persone esterne all’azienda, è semplice e immediato grazie all’integrazione di Zoom all’interno della Webmail di Qboxmail
    Strategie di mobile computing: imprese europee in difficoltà

    Strategie di mobile computing: imprese europee in difficoltà

    La continua evoluzione dei requisiti costringe a sostituire i dispositivi prima di 2 anni di utilizzo
    Hikvision immagine articolo online termiche (1)

    Hikvision: soluzioni per la sicurezza

    Numero uno al mondo nell'industria della videosorveglianza e della sicurezza, Hikvision produce un ventaglio molto ampio di soluzioni per rispondere alle esigenze di tutti...
    Infrastrutture IT aziendali verso il multicloud ibrido

    CIO sotto stress per la complessità del multicloud

    Cresce il divario tra risorse IT limitate e il ritmo sempre più rapido della trasformazione digitale
    Pandemia e infrastrutture IT: gli effetti di lungo periodo

    Pandemia e infrastrutture IT: gli effetti di lungo periodo

    Dal lavoro remoto alla continuità operativa, occhi puntati su Cloud, IoT e 5G