Google presenta Gemini 2.0, il modello di intelligenza artificiale più capace finora, con nuovi progressi nella multimodalità

gemini__hero_16-9-@2x

L’informazione è alla base del progresso umano. Per questo, da oltre 26 anni, Google lavora per organizzare le informazioni del mondo, rendendole accessibili e utili. Oggi vengono ulteriormente spinti i limiti dell’AI per organizzare queste informazioni da ogni input e renderle disponibili su qualsiasi piattaforma, offrendo un reale valore per tutti. Questa visione guidato Google nel lancio di Gemini 1.0 lo scorso dicembre. Pensato come il primo modello nativamente multimodale, Gemini 1.0 e 1.5 hanno innovato nel campo della multimodalità e del contesto esteso, permettendo di elaborare e comprendere informazioni da testo, immagini, video, audio e codice in modo più efficace.

Oggi Google presenta Gemini 2.0, il modello di intelligenza artificiale più capace finora, con nuovi progressi nella multimodalità, come l’output nativo di immagini e audio e l’uso nativo di strumenti che gettano le basi per esperienze agenziali in grado di pianificare, ricordare e agire per voi con la vostra guida.

“Da oggi condividiamo anche le frontiere della nostra ricerca agenziale mostrando i prototipi abilitati dalle capacità multimodali native di Gemini 2.0” commenta Sundar Pichai, CEO di Google e Alphabet.

Gemini 2.0 Flash – disponibile oggi

“Oggi rilasciamo il primo modello della famiglia Gemini 2.0: una versione sperimentale di Gemini 2.0 Flash – il nostro modello di base con bassa latenza e prestazioni migliorate – che gli sviluppatori possono iniziare a utilizzare subito tramite l’API Gemini in Google AI Studio e Vertex AI.

Inoltre, a partire da oggi, gli utenti Gemini di tutto il mondo possono accedere a una versione sperimentale ottimizzata per la chat di 2.0 Flash selezionandola nel menu a tendina del modello su desktop e web mobile. Gli utenti di Gemini Advanced avranno anche accesso a una nuova funzione chiamata Deep Research. 

Inoltre, stiamo portando le capacità di ragionamento avanzato di Gemini 2.0 in AI Overviews (ancora non disponibili in Italia) per rispondere a domande in più fasi, come equazioni matematiche avanzate, interrogazioni multimodali e sfide di codifica”. 

Sperimentare per il futuro

Per verificare come le esperienze agenziali possano funzionare in modo sicuro e in condizioni pratiche, Google sta rilasciando una serie di prototipi ed esperimenti di ricerca alla community di tester fidati:

  • Agenti con ragionamento multimodale: Project Astra, il prototipo di ricerca che esplora le capacità di un assistente AI universale, è migliorato con la versione 2.0 ed è ora disponibile per un gruppo di tester fidati.
  • Agenti che possono aiutarvi a svolgere compiti complessi: Project Mariner, il primo prototipo di ricerca costruito con Gemini 2.0 che esplora il futuro dell’interazione uomo-agente, a partire dal browser, è anch’esso disponibile per un gruppo limitato di tester fidati.
  • Agenti per sviluppatori: Jules, un agente di codifica sperimentale alimentato dall’intelligenza artificiale che si integra direttamente nel flusso di lavoro di GitHub e che è disponibile oggi.
  • Agenti applicati a diversi domini: Sono stati formati agenti che utilizzano Gemini 2.0 per aiutare a navigare gli utenti nel mondo virtuale dei videogiochi e agenti in grado di aiutare nel mondo fisico applicando le capacità di ragionamento spaziale di Gemini 2.0 alla robotica.