Storia dell'intelligenza artificiale: dalle origini a ChatGPT, Gemini e Claude
Un viaggio di oltre settant'anni che parte dalle intuizioni di Alan Turing e arriva ai modelli generativi che usiamo ogni giorno
Quando si parla di intelligenza artificiale, oggi il pensiero corre subito a ChatGPT, agli assistenti vocali e ai generatori di immagini comparsi negli ultimi anni. È facile pensare che si tratti di una tecnologia nata da poco, ma in realtà la storia dell'intelligenza artificiale è cominciata oltre settant'anni fa, ben prima che esistessero i personal computer, internet e i moderni smartphone.
In questa guida ripercorriamo le tappe principali di questo lungo cammino: dalle prime intuizioni di Alan Turing negli anni Cinquanta, alla nascita ufficiale del termine "intelligenza artificiale", fino alla rivoluzione del machine learning e all'esplosione dei modelli generativi che, oggi, sono diventati strumenti di uso quotidiano per milioni di persone.
Cos'è l'intelligenza artificiale: una definizione di partenza
Prima di addentrarci nella storia, è utile chiarire di cosa parliamo. Con intelligenza artificiale (o AI, dall'inglese Artificial Intelligence) si intende la capacità delle macchine di svolgere compiti che normalmente richiederebbero l'intelligenza umana: comprendere il linguaggio, riconoscere immagini, prendere decisioni, risolvere problemi.
Va detto fin da subito che queste macchine non "pensano" davvero come facciamo noi: seguono regole, elaborano enormi quantità di dati e ne ricavano risposte coerenti. Il risultato, però, può essere così convincente da sembrare il frutto di un vero ragionamento umano. È proprio questa apparente intelligenza ad aver affascinato per oltre settant'anni scienziati, matematici e filosofi, alimentando la ricerca che oggi rende possibili strumenti come ChatGPT, Siri o i traduttori automatici.
Le radici letterarie (antiche) dell'idea di macchina pensante
L'intelligenza artificiale è una tecnologia recente, ma l'idea che sta alla sua base è molto più antica di quanto si pensi. Per secoli, scrittori, filosofi e ingegneri hanno fantasticato sulla possibilità di costruire macchine capaci di pensare e agire come gli esseri umani, anticipando in qualche modo concetti che soltanto nel Novecento avrebbero trovato una base scientifica.
Dai sogni letterari ai primi automi
Già nel 1726, lo scrittore irlandese Jonathan Swift, nel celebre romanzo I viaggi di Gulliver, immaginava una grande macchina meccanica in grado di generare frasi e libri combinando parole in modo automatico. Con un po' di fantasia, è una visione che anticipa di quasi tre secoli il funzionamento dei moderni modelli generativi.
Nel 1914, l'ingegnere spagnolo Leonardo Torres y Quevedo presenta a Parigi El Ajedrecista, una macchina elettromeccanica in grado di giocare contro un avversario umano una specifica fase finale di una partita a scacchi: avendo a disposizione il proprio re e una torre, contro il solo re dell'avversario, El Ajedrecista riusciva ad arrivare allo scacco matto in autonomia, muovendo i pezzi senza alcun intervento esterno.
Pochi anni dopo, nel 1921, lo scrittore ceco Karel Čapek mette in scena a Praga la commedia R.U.R. (Rossumovi Univerzální Roboti). È in quest'opera teatrale che, per la prima volta, compare la parola "robot", destinata a entrare nel vocabolario di tutto il mondo per indicare le macchine costruite per svolgere lavori al posto degli esseri umani.
Le fondamenta teoriche del Novecento
Tra gli anni Trenta e Quaranta del Novecento, le basi teoriche di quella che sarebbe diventata l'intelligenza artificiale iniziano a prendere forma. Nascono i primi calcolatori elettronici, capaci di eseguire operazioni complesse in tempi rapidissimi, e con essi cresce l'idea che una macchina possa, prima o poi, replicare alcune funzioni del cervello umano.
Un passaggio fondamentale arriva nel 1943, quando il neurofisiologo Warren McCulloch e il matematico Walter Pitts pubblicano uno studio in cui propongono per la prima volta un modello matematico ispirato al funzionamento dei neuroni. In quell'intuizione si trovano i semi delle moderne reti neurali artificiali, una delle tecnologie alla base dell'IA di oggi. All'epoca si trattava di pura teoria — mancavano computer abbastanza potenti per metterla in pratica — ma l'idea era ormai sul tavolo, pronta per essere ripresa e completata nei decenni successivi.
Alan Turing e la nascita ufficiale dell'intelligenza artificiale
Tra le figure che hanno segnato la storia dell'intelligenza artificiale, Alan Turing occupa senza dubbio una posizione centrale. Il matematico britannico, già celebre per aver contribuito a decifrare il codice della macchina Enigma usata dai tedeschi durante la Seconda guerra mondiale, è la prima persona ad aver posto in termini scientifici la domanda da cui tutto è partito: una macchina può pensare?
Il test di Turing
Nel 1950, Turing pubblica un articolo destinato a diventare un classico della disciplina: Computing Machinery and Intelligence. In queste pagine, invece di addentrarsi in una definizione filosofica di "pensiero" o di "intelligenza", propone un approccio molto più pragmatico, riformulando la domanda in termini operativi: una macchina può comportarsi in modo così simile a un essere umano da risultare indistinguibile da lui?
Per rispondere, Turing immagina quello che oggi tutti conoscono come test di Turing (o "gioco dell'imitazione"). Il principio è semplice: un valutatore umano dialoga via testo, senza vedere i suoi interlocutori, con un altro essere umano e con una macchina. Se al termine della conversazione il valutatore non riesce a distinguere quale dei due sia il computer, allora — secondo Turing — la macchina può essere considerata intelligente.
Del test abbiamo parlato anche in questo video sul nostro canale YouTube ufficiale:
Vale la pena ricordare che, sebbene diversi sistemi moderni siano in grado di superare versioni semplificate di questo test, tra gli esperti il dibattito è ancora aperto: il test di Turing misura davvero l'intelligenza, oppure soltanto la capacità di una macchina di imitare il modo in cui si esprime un essere umano?
Quando nasce il termine "intelligenza artificiale"?
Il termine "intelligenza artificiale", però, non viene coniato da Turing. Per vederlo comparire ufficialmente bisogna aspettare il 1956 e una conferenza estiva organizzata al Dartmouth College, negli Stati Uniti, da un gruppo di studiosi tra cui spiccano John McCarthy e Marvin Minsky.
Per due mesi, un piccolo gruppo di matematici e informatici si riunisce per discutere come costruire macchine in grado di usare il linguaggio, formulare concetti astratti, risolvere problemi tipicamente umani e migliorarsi da sole. È durante questo incontro che McCarthy propone l'espressione artificial intelligence, destinata a diventare rapidamente il nome ufficiale della disciplina.
La conferenza di Dartmouth viene comunemente considerata l'atto di nascita dell'intelligenza artificiale come campo di ricerca autonomo. Prima di quel momento, gli stessi temi venivano studiati sotto etichette diverse, come cibernetica o teoria degli automi. Da quel 1956 in poi, l'IA ha una sua identità, un suo nome e una comunità di ricercatori che si riconoscono in essa.
Dall’ottimismo agli “inverni” dell’IA
Negli anni successivi alla conferenza di Dartmouth, l'entusiasmo intorno all'intelligenza artificiale è alle stelle. Molti ricercatori sono convinti che, nel giro di qualche decennio, le macchine raggiungeranno un livello di intelligenza paragonabile a quello umano. E i primi risultati, in effetti, sembrano dare ragione agli ottimisti. L’entusiasmo però si spegne negli anni ‘70.
I primi successi
Già nel 1951, in Inghilterra, il matematico Christopher Strachey scrive un programma capace di giocare partite complete a dama. Pochi anni dopo, il ricercatore statunitense Arthur Samuel porta avanti un'iniziativa simile: il suo programma, oltre a saper giocare a dama, è anche in grado di migliorare le proprie prestazioni partita dopo partita, imparando dall'esperienza. È proprio Samuel, nel 1959, a coniare l'espressione machine learning (apprendimento automatico), uno dei concetti più importanti dell'intera storia dell'IA: l'idea che una macchina, invece di seguire passo passo le istruzioni di un programmatore, possa imparare da sola osservando una grande quantità di esempi.
Nello stesso periodo, i ricercatori Allen Newell e Herbert Simon sviluppano il Logic Theorist, un programma capace di dimostrare teoremi matematici, e poi il General Problem Solver, un sistema pensato per affrontare problemi di natura diversa seguendo schemi di ragionamento generali. Sono i primi esempi di software in grado di replicare, almeno in parte, il modo in cui gli esseri umani affrontano i problemi complessi.
Il perceptron: la prima rete neurale
Sul fronte delle reti neurali artificiali, una svolta arriva invece nel 1957, quando lo psicologo statunitense Frank Rosenblatt realizza il Perceptron, sistema in grado di riconoscere semplici schemi visivi, ispirandosi direttamente al funzionamento dei neuroni del cervello. Per imparare a riconoscere uno schema, per esempio una semplice forma geometrica, il Perceptron riceve in ingresso una serie di esempi e prova a classificarli. A ogni errore commesso, il sistema regola leggermente alcuni valori numerici interni — chiamati "pesi" — che determinano il modo in cui i segnali di ingresso vengono combinati per arrivare alla risposta finale. Ripetendo questo processo su molti esempi, il Perceptron diventa progressivamente più accurato nelle sue risposte.
Alla fine degli anni Sessanta, però, Marvin Minsky e Seymour Papert ne hanno evidenziato i limiti matematici in un libro destinato a fare scuola, raffreddando rapidamente l'entusiasmo. Solo decenni più tardi ci si renderà conto che quei limiti potevano essere superati combinando più strati di neuroni a cascata: ma per arrivarci ci vorranno anni di pazienza e una nuova generazione di ricercatori.

ELIZA e i sistemi esperti
Nel 1966, al MIT, il ricercatore Joseph Weizenbaum sviluppa ELIZA, uno dei primi programmi capaci di simulare una conversazione in linguaggio naturale. ELIZA imitava il comportamento di uno psicoterapeuta, restituendo all'utente le sue stesse frasi sotto forma di domanda. Il funzionamento era piuttosto semplice e basato su poche regole, ma molte persone che lo provarono finirono per attribuirgli una vera capacità di pensiero: un effetto che colse di sorpresa lo stesso Weizenbaum e che, in qualche modo, anticipò di sessant'anni le reazioni suscitate oggi dai moderni chatbot.
Negli stessi anni nascono anche i primi sistemi esperti, ovvero programmi specializzati nel risolvere problemi in ambiti molto specifici, applicando regole codificate a partire dalla conoscenza di esperti umani. Il più noto è MYCIN, sviluppato all'inizio degli anni Settanta presso l'Università di Stanford: era in grado di assistere i medici nella diagnosi di infezioni batteriche e nella scelta della terapia antibiotica più appropriata. Sistemi di questo tipo funzionavano molto bene all'interno del loro ambito di applicazione, ma faticavano non appena venivano usati al di fuori del contesto per cui erano stati progettati.
Gli "inverni" dell'intelligenza artificiale
Negli anni Settanta, l'entusiasmo che aveva accompagnato i primi passi dell'intelligenza artificiale comincia a vacillare. Le ambizioni dei ricercatori sono altissime, ma la tecnologia disponibile non riesce a tenere il passo: i computer dell'epoca sono troppo lenti, hanno poca memoria e non possono gestire la complessità dei problemi reali. I risultati promessi tardano ad arrivare e gli investitori iniziano a perdere fiducia.
Nel 1973, un rapporto commissionato dal governo britannico al matematico James Lighthill, mette nero su bianco tale disillusione, suggerendo di interrompere buona parte dei finanziamenti pubblici in Intelligenza Artificiale. Il rapporto Lighthill ha un impatto enorme: nel giro di pochi mesi, il Regno Unito taglia i fondi destinati alla ricerca sull'IA e gli Stati Uniti seguono a ruota. È l'inizio di quello che gli storici della disciplina chiameranno il primo inverno dell'intelligenza artificiale.
Una breve rinascita si registra negli anni Ottanta, grazie al successo commerciale dei sistemi esperti, adottati da grandi aziende per automatizzare compiti specifici come la configurazione di ordini, l'analisi di documenti o la gestione dei magazzini. Anche questa stagione, però, si rivela poco longeva: i sistemi esperti sono costosi da mantenere, rigidi nelle proprie applicazioni e incapaci di adattarsi a situazioni nuove. A metà del decennio arriva così un secondo inverno, ancora più severo del primo, durante il quale lo stesso termine "intelligenza artificiale" viene quasi evitato nei progetti di ricerca, per non spaventare gli investitori.
Per tornare al centro della scena, l'intelligenza artificiale dovrà aspettare nuovi strumenti, nuove idee e — soprattutto — computer di nuova generazione.
Il ritorno: il machine learning trova la sua strada
Dopo due decenni complicati, l'intelligenza artificiale torna lentamente a far parlare di sé. La svolta non arriva da un singolo evento, ma da una serie di fattori concomitanti: alcuni progressi scientifici, l'aumento della potenza dei computer e la disponibilità — sempre maggiore — di grandi quantità di dati su cui far lavorare i programmi. È in questa fase che il machine learning comincia a imporsi come l'approccio più promettente: invece di scrivere a mano tutte le regole che un programma deve seguire, si lascia che sia lui stesso a ricavarle, osservando un gran numero di esempi.
La svolta della backpropagation (1986)
Una delle innovazioni che riaccendono l'interesse per le reti neurali arriva nel 1986, quando un gruppo di ricercatori — tra cui il britannico Geoffrey Hinton, oggi considerato uno dei padri del deep learning — pubblica uno studio fondamentale sull'algoritmo di backpropagation, ovvero "propagazione all'indietro dell'errore".
Si tratta di un metodo matematico che permette alle reti neurali di apprendere in modo molto più efficiente. Quando la rete commette un errore, l'algoritmo "torna indietro" attraverso i diversi strati di neuroni artificiali e regola automaticamente i valori interni, in modo da migliorare le risposte future. In pratica, la backpropagation rende possibile addestrare reti composte da molti strati, superando i limiti che Minsky e Papert avevano evidenziato vent'anni prima. È questo passaggio che, decenni dopo, aprirà la strada al deep learning.
Deep Blue e la vittoria su Kasparov (1997)
Un evento simbolico, che riporta l'intelligenza artificiale sotto i riflettori del grande pubblico, avviene nel 1997: il supercomputer Deep Blue batte in una partita a scacchi il campione del mondo in carica Garry Kasparov. È la prima volta nella storia.
Non si tratta, in realtà, di un trionfo del machine learning: Deep Blue era una macchina altamente specializzata, in grado di esaminare circa 200 milioni di mosse al secondo grazie a una potenza di calcolo enorme per l'epoca. L'impatto mediatico della vittoria, però, è enorme e contribuisce a riportare il tema dell'intelligenza artificiale al centro dell'attenzione anche fuori dai laboratori di ricerca.
ImageNet, GPU e la svolta del 2012
Un passaggio cruciale è la nascita, nel 2007, di ImageNet, un'enorme banca dati di immagini etichettate manualmente, organizzata da un gruppo di ricerca dell'Università di Princeton. ImageNet diventa rapidamente il punto di riferimento per misurare le prestazioni dei sistemi di riconoscimento delle immagini, mettendo a disposizione dei ricercatori milioni di esempi su cui allenare i loro modelli.
Allo stesso tempo, ci si rende conto che le GPU — le schede grafiche nate originariamente per i videogiochi — sono particolarmente adatte ad addestrare le reti neurali, perché in grado di eseguire molte operazioni matematiche in parallelo. È un'intuizione che cambia radicalmente la velocità con cui un modello di IA può imparare a fare il proprio lavoro.
Il salto di qualità arriva nel 2012, quando un gruppo di ricercatori dell'Università di Toronto guidato da Geoffrey Hinton presenta AlexNet, una rete neurale profonda che vince la sfida annuale legata a ImageNet con un margine di vantaggio enorme rispetto ai sistemi tradizionali. Da quel momento, il deep learning diventa lo standard di riferimento per il riconoscimento di immagini, suoni e linguaggio.
2011 l'IA entra nello smartphone
Nel 2011, Apple integra Siri all'interno di iPhone e mette per la prima volta a disposizione del grande pubblico un dispositivo capace di rispondere a domande, impostare promemoria e inviare messaggi tramite comando vocale. Negli anni successivi, Google, Amazon e Microsoft seguono la stessa strada con i propri assistenti (Google Assistant, Alexa, Cortana), trasformando la voce in un'interfaccia naturale per interagire con la tecnologia.
AlphaGo e i giochi complessi (2016)
Un'altra tappa simbolica arriva nel 2016, quando il sistema AlphaGo, sviluppato dal laboratorio Google DeepMind, batte il campione sudcoreano Lee Sedol nel Go, un gioco da tavolo di origine asiatica considerato molto più complesso degli scacchi: si stima che il numero di partite possibili sia superiore al numero di atomi presenti nell'universo osservabile.
A differenza di Deep Blue, AlphaGo non si limita a calcolare il maggior numero possibile di mosse: utilizza tecniche di deep learning per "intuire" quali siano le strategie migliori, in modo non troppo diverso da come fa un giocatore umano esperto. La sua vittoria viene salutata come la prova che il deep learning è ormai in grado di affrontare anche problemi che fino a pochi anni prima sembravano fuori dalla sua portata.

L'era dell'IA generativa (dal 2020 a oggi)
Negli ultimi anni, l'intelligenza artificiale è entrata in una fase completamente nuova, che molti hanno definito era dell'IA generativa. La novità sostanziale è che, oggi, le macchine non si limitano più a riconoscere o classificare contenuti esistenti: sono in grado di crearne di nuovi, generando testi, immagini, video, brani musicali e codici di programmazione a partire da semplici istruzioni in linguaggio naturale.
GPT-3 e l'esplosione dei modelli linguistici di grandi dimensioni
Una delle date chiave di questa nuova fase è il 2020, quando l'azienda statunitense OpenAI rende noto GPT-3, un modello linguistico di grandi dimensioni — i cosiddetti LLM (Large Language Models) — addestrato su un'enorme quantità di testi raccolti da Internet. GPT-3 è in grado di scrivere articoli, rispondere a domande, riassumere documenti e portare avanti conversazioni in modo molto convincente.
Due anni dopo, alla fine del 2022, OpenAI rende accessibile gratuitamente al pubblico una versione conversazionale evoluta di questa tecnologia: ChatGPT. In pochi mesi, il servizio raggiunge centinaia di milioni di utenti in tutto il mondo, diventando per molti il primo, vero contatto con l'intelligenza artificiale. È a partire da questo momento che il tema esplode nel dibattito pubblico, spingendo le principali aziende tecnologiche — da Google a Microsoft, da Meta ad Amazon — a sviluppare e a integrare propri modelli generativi all'interno dei loro servizi.
DALL-E, Sora e la generazione di immagini e video
Accanto ai modelli linguistici, si sviluppano in parallelo sistemi capaci di generare immagini e video a partire da semplici descrizioni testuali. È il caso di DALL-E, sempre di OpenAI, che a partire dal 2021 permette di creare immagini originali partendo da poche righe di testo. A questo strumento si aggiungono altri sistemi diventati molto popolari, come Midjourney e Stable Diffusion.
Nel 2024, OpenAI annuncia Sora, un modello in grado di generare brevi video realistici sempre a partire da descrizioni in linguaggio naturale: si tratta di una nuova frontiera che apre scenari interessanti tanto per la creatività quanto per la produzione di contenuti, ma che porta con sé anche importanti questioni in tema di autenticità delle informazioni e di possibili usi impropri.
Gli assistenti AI nei prodotti di tutti i giorni
Negli ultimi anni, l'intelligenza artificiale generativa ha iniziato a integrarsi nei prodotti e nei servizi che usiamo ogni giorno. Le principali app di messaggistica, come WhatsApp e Instagram, ospitano assistenti basati sull’IA in grado di rispondere a domande direttamente all'interno delle chat. Gli stessi assistenti vocali domestici, come Alexa, stanno evolvendo verso versioni più avanzate basate su modelli generativi, capaci di sostenere conversazioni più naturali ed eseguire azioni più complesse.
Allo stesso modo, i principali sistemi operativi per smartphone, computer e dispositivi indossabili stanno integrando funzionalità basate sull'intelligenza artificiale: dalla generazione di testi al riassunto automatico di documenti, fino al miglioramento delle fotografie.
In poco più di settant'anni, l'intelligenza artificiale è passata da intuizione teorica sviluppata sui taccuini di pochi matematici a tecnologia di uso quotidiano per miliardi di persone. Il percorso, come abbiamo visto, è stato tutt'altro che lineare: tra entusiasmi, crisi, ripartenze e svolte improvvise, la storia dell’Intelligenza Artificiale ha attraversato decenni di evoluzione: ciò che vediamo oggi è probabilmente soltanto un capitolo intermedio di una storia ancora tutta da scrivere.
Per concludere, ti lascio altri articoli di approfondimento nell'ambito Intelligenza Artificiale Generativa:
1.Cos'è Gemini e come funziona?
2.Cos'è Copilot e come funziona?
3. Cos'è Claude AI e come funziona?