L’AI supera il linguaggio e irrompe nella realtà
ll primo step è stato il linguaggio, ma ora non basta più. Con robotica e modelli multimodali l'intelligenza artificiale entra nel mondo fisico. Gli scenari.
Siamo felicissimi di ospitare il primo contributo esterno qui nella newsletter di iapertutti.it.
Fin dal primo giorno, il nostro obiettivo è stato quello di riunire professionisti, pensatori e appassionati per offrire approfondimenti, analisi stimolanti, news approfondite e tanti tutorial.
Prima di lasciarti al nostro primo ospite, ti condivido qualche link che sono certo apprezzerai:
Nuove risorse gratuite https://iapertutti.it/risorse-gratuite-iapertutti/
Nuovo tutorial (Google NotebookLM in Italiano! Guida completa alla super AI)
Nuovo Instagram (ci siamo rifatti il look :)
di Annachiara Piscitelli (Conversation Designer)
Dal primo vagito alla nostra ultima parola, passando per temi scritti a penna, canzoni urlate a pieni polmoni, dichiarazioni d’amore sussurrate, poesie recitate in piedi su una sedia il giorno di Natale, leggerissime chiacchiere da bar, pensieri gelosamente custoditi nella propria mente, cori, inni, attacchi, difese o semplici liste della spesa, il linguaggio è quel qualcosa di intrinsecamente umano che ci accompagna fin dal giorno zerodella nostra esistenza.
Questa facoltà così peculiare, che determina in maniera decisiva la nostra differenza rispetto a tutti gli altri esseri viventi del pianeta Terra, rimane tuttora per moltissimi versi un mistero. Da dove deriva? Come si è sviluppata? L’abbiamo sempre avuta o c’è stato un momento in cui è emersa? Perché siamo proprio noi a esserne detentori?
Le domande ancora aperte sul linguaggio, che altro non sono che domande sulla nostra stessa natura, sono svariate. Eppure, né questo difetto di comprensione né la sua essenza unica, ci hanno trattenuto dal tentativo di replicarlo.
Oggi siamo in grado di dialogare con le macchine e le macchine sono in grado di dialogare con noi. E per quanto già questo sia sorprendente, non ci basta. Ora che all’intelligenza artificiale è stata donata la parola, vogliamo che faccia di più: che usi questa parola, la nostra parola umana, per interagire con il mondo.
In principio era il verbo
La capacità di comprendere e riprodurre il linguaggio umanopropria dei Large Language Model (LLM) come GPT (il modello linguistico alla base di ChatGPT, ora disponibile nella potente versione 4o) ha smesso di stupirci.
L’utilizzo sempre più diffuso e più variegato di interfacce conversazionali basate sull’IA è già diventato un vero e proprio fenomeno degno di essere studiato sotto tutti i punti di vista: sociologico, antropologico, psicologico, tecnologico… aggiungete liberamente un settore alla lista e troverete che qualcuno ha iniziato a esplorarlo in relazione all’intelligenza artificiale.
Tutto questo ci mette dinanzi a un fatto innegabile: quella facoltà così squisitamente umana di cui parlavamo all’inizio non è più soltanto nostra.
Proprio come il Dio del celebre affresco di Michelangelo quasi tocca il dito di Adamo per donargli il soffio della vita, così noi abbiamo pigiato un tasto che ha fatto sì che cedessimo il nostro linguaggio alle macchine.
Dalle parole alle azioni: la nuova frontiera dell’intelligenza artificiale
Compiuto questo gesto divino, qualcuno potrebbe pensare che la storia finisca qui. Ma la Genesi è soltanto il primo libro della Bibbia e noi essere umani siamo famosi per la nostra bramosia di spingerci oltre.
Tant’è che non ci è voluto molto prima che qualche curioso della nostra specie si ponesse un nuovo e seducente interrogativo: ora che abbiamo concesso alle macchine la nostra chiave di lettura del mondo, perché non farle interagire con esso?
Videogiochi: il campo d’addestramento perfetto per la prossima generazione di IA
Qualcuno ha iniziato letteralmente a giocare con questo quesito, arrivando a ottenere risultati strabilianti.
Parliamo del team di ricerca di Google DeepMind che di recente ha presentato SIMA (Scalable Instructable Multiworld Agent): un’intelligenza artificiale capace di comprendere scenari di gioco diversi e di seguire istruzioni in linguaggio naturale per svolgere attività al loro interno, proprio come farebbe un essere umano.
Quella che potrebbe sembrare una rivoluzione confinata all’esperienza di gioco virtuale, in realtà apre le porte a un mondo dove modelli avanzati di IA non sono soltanto in grado di capire un’istruzione ma anche di eseguire un’azione che va ben oltre l’abilità di riprodurre il linguaggio.
Un mondo in cui esiste questa possibilità, non è affatto lontano.
Lo ha dimostrato Covariant, azienda specializzata in robotica, con il suo RFM-1: un modello in grado di interagire con il mondo fisico manipolando gli oggetti intorno a sé nel modo più “intelligente” possibile.
Addestrata su una mole di dati vastissima e sfaccettata, questo tipo di IA ha la capacità di compiere dei ragionamenti che le consentono di prevedere le azioni da compiere per raggiungere un determinato obiettivo, e successivamente di eseguirle.
E indovinate come viene fornita l’istruzione che spiega il compito da svolgere? Ovviamente, in linguaggio naturale.
Niente più barriere tecniche, tanto che se la previsione del modello dovesse rivelare, per esempio, che sarà impossibile afferrare correttamente un oggetto, RFM-1 potrebbe addirittura rispondere: “Non riesco a ottenere una buona presa. Hai qualche consiglio?”.
Il futuro con le IA: paradiso terrestre o giorno del giudizio?
Se l’ultima chicca di Covariant accorcia la distanza tra il presente e un futuro in cui uomini e macchine convivono e collaborano fra loro, il nuovo Atlas di Boston Dynamics potrebbe trasformare questa prospettiva da idilliaca ad apocalittica.
Parliamo di un robot umanoide capace di muoversi con un’agilità, una destrezza e una fluidità oltre ogni immaginario. Tanto che il CEO Robert Playter ha dichiarato che “questo robot nella maggior parte delle sue articolazioni sarà più forte di una persona, persino di un atleta d’élite, e avrà una gamma di movimenti che supera qualsiasi capacità di un essere umano”.
Insomma, ora che abbiamo dotato le macchine della nostra facoltà di parola e di movimento, lanciamo a loro la sfida di superarci. Gli antichi greci avrebbero condannato la nostro hybris o avrebbero ammirato la nostra audacia?
FAQ
Cosa significa GPT?
Generative Pre-trained Transformers: un tipo di modello linguistico di grandi dimensioni basato sull’architettura dei transformers, pre-addestrati appunto su enormi quantità di dati di testo e in grado di generare nuovi contenuti simili a quelli umani.
Che cos’è ChatGPT?
ChatGPT è un modello di linguaggio avanzato sviluppato da OpenAI, basato sull’architettura GPT. Si tratta di un sistema di intelligenza artificiale che utilizza apprendimento automatico per comprendere e generare testo in modo coerente e contestuale. ChatGPT è addestrato su una vasta gamma di dati linguistici, consentendogli di rispondere a domande, completare frasi e interagire in modo naturale con gli utenti.
Che cos’è GPT-4o?
GPT-4o (dove la ‘o’ sta per omni) è il più recente modello sviluppato da OpenAI. Si tratta di un’espansione di GPT-4, più potente, più veloce e soprattutto multimodale: questo significa che può interagire con testo, audio, video e immagini. Di seguito trovi un tutorial completo che ti spiega come usare ChatGPT-4o.
Scopri le risorse gratuite di iapertutti.it
Ecco il link alle nostre risorse gratuite: benvenuto/a a bordo!
Aggiungiti alla community di iapertutti.it
Entra nella community Telegram e WhatsApp per ricevere news e approfondimenti sul mondo dell’intelligenza artificiale e chattare con altri appassionati.