"Chiedersi se un computer possa pensare non è più interessante del chiedersi se un sottomarino possa nuotare." — Edsger W. Dijkstra
Edsger Dijkstra era un uomo di precisione. Uno dei padri dell'informatica moderna, premio Turing nel 1972, passò la sua carriera a insegnare una cosa sola: le parole che usiamo per descrivere i sistemi computazionali non sono dettagli — sono la sostanza stessa del ragionamento. E questa frase, apparentemente ironica, nasconde un argomento filosfico di rara lucidità.
Un sottomarino si muove nell'acqua. Lo fa in modo efficace, spesso meglio di qualsiasi essere vivente. Ma "nuotare" implica una coordinazione organica, un'intenzione motoria, un corpo che si adatta al mezzo. Il sottomarino non nuota: si propelle. La domanda se nuoti è mal posta, non perché la risposta sia no, ma perché applica una categoria sbagliata a un oggetto sbagliato.
Oggi, nell'era dei grandi modelli linguistici, ci ritroviamo a fare esattamente lo stesso errore — ma le conseguenze sono molto più gravi.
Quando un sistema come GPT-4, Claude, o Gemini produce una risposta articolata, risolve un problema di matematica o sembra ragionare per analogia, cosa accade tecnicamente? Un modello linguistico di grandi dimensioni è, nella sua essenza, una macchina statistica. È stato addestrato su miliardi di testi per apprendere quali sequenze di parole tendono a seguire altre sequenze di parole, in quali contesti, con quale probabilità.
Non c'è una rappresentazione interna del mondo. Non c'è un modello mentale che si aggiorna. Non c'è memoria episodica — ogni conversazione ricomincia da zero. Quello che chiamiamo "risposta intelligente" è, con grande precisione tecnica, la previsione della token più probabile dato il contesto fornito.
Quello che Turing non aveva previsto è che saremmo stati capaci di costruire sistemi che superano quel test comportamentale senza avvicinarsi di un millimetro alla comprensione. I modelli attuali producono linguaggio fluente, coerente, spesso brillante — e tuttavia non "sanno" nulla nel senso in cui lo sa un bambino di cinque anni che riconosce il gatto nel cortile.
Il filosofo John Searle lo aveva anticipato nel 1980 con il suo esperimento mentale della "Stanza Cinese": un operatore che non conosce il cinese, seguendo regole formali, può rispondere correttamente a domande in cinese senza capire una sola parola. Il sistema produce output corretti. Non comprende nulla. La simulazione della competenza non è la competenza.
Fin qui, potremmo liquidare il tutto come un dibattito filosofico. Ma l'equivoco ha conseguenze pratiche molto concrete, e sempre più urgenti.
Nel 2025 e 2026, l'adozione di sistemi di IA in contesti critici — diagnosi mediche, selezione del personale, decisioni giuridiche, guida autonoma — è accelerata in modo esponenziale. E con essa è cresciuta una fiducia spesso ingiustificata nella "capacità di ragionamento" di questi sistemi.
Un modello linguistico, per quanto sofisticato, alucina. Produce informazioni false con la stessa fluenza con cui produce quelle vere. Non distingue tra ciò che sa e ciò che inventa: semplicemente produce la sequenza più probabile. In un contesto a basso rischio — scrivere un'email, generare un riassunto — questo è un inconveniente gestibile. In un contesto dove le decisioni riguardano persone reali, diventa un problema strutturale.
Affidarsi a un modello linguistico per una "decisione affidabile" è come chiedere a un sismografo di prevedere un terremoto: lo strumento misura qualcosa di reale, ma non nel modo in cui pensiamo.
La questione non è se l'IA sia utile — lo è, straordinariamente. La questione è se gli stiamo assegnando il tipo di fiducia giusto, basata su una comprensione corretta di cosa fa realmente. E la risposta, troppo spesso, è no.
L'equivoco persiste per ragioni comprensibili. I modelli moderni producono output che, superficialmente, assomigliano al ragionamento umano. Usano connettivi logici. Costruiscono argomentazioni. Citano premesse e traggono conclusioni. Il formato mima la struttura del pensiero razionale.
Ma mimarne la struttura non significa replicarne il processo. Un attore che recita Amleto non sta davvero considerando il suicidio. Un navigatore GPS non "conosce" la strada — segue un grafo di nodi e archi. E un modello linguistico che produce una spiegazione medica coerente non sta "ragionando sulla salute del paziente" — sta generando la sequenza testuale più plausibile dato il prompt.
Il pericolo è duplice. Da un lato, rischiamo di delegare a questi sistemi responsabilità che richiedono comprensione genuina — e di fidarci dei risultati senza verificarli. Dall'altro, investiamo enormi aspettative e risorse in una direzione che potrebbe non portare dove pensiamo: costruire sistemi sempre più grandi e potenti nella speranza che la comprensione emerga spontaneamente dalla scala.
Dijkstra non stava dicendo che i computer siano inutili, né che la domanda sull'intelligenza artificiale sia priva di senso. Stava dicendo che la domanda mal posta è peggio dell'assenza di domanda, perché orienta la ricerca nella direzione sbagliata.
La domanda utile non è "l'IA può pensare?" ma "in quali compiti questi sistemi producono output affidabili, e in quali no? Dove la loro struttura statistica è uno strumento potente, e dove diventa pericolosamente inadeguata?"
Rispondere a questa domanda richiede che smettiamo di proiettare sul calcolo le categorie del pensiero — e che iniziamo a valutare l'IA per quello che è: uno strumento di straordinaria utilità in molti domini, e di straordinario rischio quando si pretende che faccia ciò per cui non è stato progettato.
Il sottomarino è una macchina meravigliosa. Non nuota. E va benissimo così — a patto di sapere cosa stiamo mettendo in acqua.