Il libro Distributional Semantics del professor Lenci dell’Università di Pisa è la prima trattazione sistematica sulla semantica distribuzionale, l’insieme di teorie e metodi che spiega come i sistemi d’intelligenza artificiale apprendono l’uso del linguaggio

La semantica distribuzionale comprende una serie di teorie e metodi di linguistica computazionale per lo studio della distribuzione semantica delle parole nel linguaggio naturale. Questi modelli derivano da una prospettiva empiristica e assumono che una distribuzione statistica dei termini sia preponderante nel delinearne il comportamento semantico.

Per la prima volta, questa disciplina ha trovato una trattazione completa nel volume Distributional Semantics della Cambridge University Press scritto da Alessandro Lenci dell’Università di Pisa e da Magnus Sahlgren di Artificial Intelligence Sweden. Il libro mette chiaramente in luce come i sistemi di intelligenza artificiale, ad esempio ChatGPT, imparino come noi umani il significato delle parole osservando i contesti linguistici in cui sono usate.

“Come i computer anche noi impariamo molti concetti osservando come le parole sono usate nei contesti linguistici, e questo è uno dei fattori fondamentali del potere creativo della mente umana – spiega Alessandro Lenci – Questo rende la semantica distribuzionale un’affascinante area di ricerca che combina prospettive teoretiche, computazionali e cognitive per lo studio del linguaggio e la sua applicazione per sviluppare sistemi artificiali intelligenti”.

Facciamo un esempio per capire come funziona il meccanismo: prendiamo l’ipotetica parola “blimp”. Dalla frase “Ho appena bevuto del blimp ghiacciato”, si può capire facilmente che si deve trattare di un qualche tipo di liquido. Se invece la stessa parola si trovasse nella frase “Un blimp ha abbaiato tutta la notte”, è chiaro che “blimp” si riferisce a un animale, molto probabilmente ad un tipo di cane. Questi semplici casi illustrano il principio in base al quale funzionano i modelli computazionali di semantica distribuzionale: imparano il significato delle parole e di altre espressioni linguistiche andando ad analizzare con metodi statistici e matematici i contesti in cui sono usati e le altre parole che ricorrono con esse.

“Questo tipo di metodo distribuzionale – conclude Lenci – fa parte anche del modo con cui bambini e adulti imparano i significati di molte parole arricchendo così il loro lessico, ed è lo stesso principio su cui si basano sistemi come ChatGPT per acquisire le loro conoscenze, che poi usano per rispondere alle nostre domande”.