Il sottomarino non nuota. E l'IA non pensa.

"Chiedersi se un computer possa pensare non è più interessante del chiedersi se un sottomarino possa nuotare." — Edsger W. Dijkstra

Edsger Dijkstra era un uomo di precisione. Uno dei padri dell'informatica moderna, premio Turing nel 1972, passò la sua carriera a insegnare una cosa sola: le parole che usiamo per descrivere i sistemi computazionali non sono dettagli — sono la sostanza stessa del ragionamento. E questa frase, apparentemente ironica, nasconde un argomento filosfico di rara lucidità.

Un sottomarino si muove nell'acqua. Lo fa in modo efficace, spesso meglio di qualsiasi essere vivente. Ma "nuotare" implica una coordinazione organica, un'intenzione motoria, un corpo che si adatta al mezzo. Il sottomarino non nuota: si propelle. La domanda se nuoti è mal posta, non perché la risposta sia no, ma perché applica una categoria sbagliata a un oggetto sbagliato.

Oggi, nell'era dei grandi modelli linguistici, ci ritroviamo a fare esattamente lo stesso errore — ma le conseguenze sono molto più gravi.

Cosa succede davvero dentro un modello linguistico

Quando un sistema come GPT-4, Claude, o Gemini produce una risposta articolata, risolve un problema di matematica o sembra ragionare per analogia, cosa accade tecnicamente? Un modello linguistico di grandi dimensioni è, nella sua essenza, una macchina statistica. È stato addestrato su miliardi di testi per apprendere quali sequenze di parole tendono a seguire altre sequenze di parole, in quali contesti, con quale probabilità.

Non c'è una rappresentazione interna del mondo. Non c'è un modello mentale che si aggiorna. Non c'è memoria episodica — ogni conversazione ricomincia da zero. Quello che chiamiamo "risposta intelligente" è, con grande precisione tecnica, la previsione della token più probabile dato il contesto fornito.

Da tenere a mente: La potenza di calcolo è misurabile: parametri, FLOP, latenza. Il ragionamento è qualcosa di diverso: richiede comprensione, intenzione, riferimento al mondo reale. I modelli attuali eccellono nella prima categoria. La seconda resta, ad oggi, un terreno aperto.

Questo non è un giudizio di valore: è una descrizione meccanica. E la distinzione è cruciale. Dire che un modello "ragiona" significa attribuirgli un processo che non ha — proprio come dire che un sottomarino "nuota" confonde il risultato (spostarsi sott'acqua) con il processo (la locomozione organica).

Il test di Turing non era ciò che crediamo

Alan Turing, nel 1950, propose il suo celebre test non come definizione di intelligenza, ma come modo per aggirare il problema. "Può una macchina pensare?" era, per lui, una domanda troppo mal definita per essere affrontata direttamente. Meglio chiedere: può una macchina comportarsi in modo indistinguibile da un essere umano in una conversazione?

Quello che Turing non aveva previsto è che saremmo stati capaci di costruire sistemi che superano quel test comportamentale senza avvicinarsi di un millimetro alla comprensione. I modelli attuali producono linguaggio fluente, coerente, spesso brillante — e tuttavia non "sanno" nulla nel senso in cui lo sa un bambino di cinque anni che riconosce il gatto nel cortile.

Il filosofo John Searle lo aveva anticipato nel 1980 con il suo esperimento mentale della "Stanza Cinese": un operatore che non conosce il cinese, seguendo regole formali, può rispondere correttamente a domande in cinese senza capire una sola parola. Il sistema produce output corretti. Non comprende nulla. La simulazione della competenza non è la competenza.

Il problema delle decisioni affidabili

Fin qui, potremmo liquidare il tutto come un dibattito filosofico. Ma l'equivoco ha conseguenze pratiche molto concrete, e sempre più urgenti.

Nel 2025 e 2026, l'adozione di sistemi di IA in contesti critici — diagnosi mediche, selezione del personale, decisioni giuridiche, guida autonoma — è accelerata in modo esponenziale. E con essa è cresciuta una fiducia spesso ingiustificata nella "capacità di ragionamento" di questi sistemi.

Un modello linguistico, per quanto sofisticato, alucina. Produce informazioni false con la stessa fluenza con cui produce quelle vere. Non distingue tra ciò che sa e ciò che inventa: semplicemente produce la sequenza più probabile. In un contesto a basso rischio — scrivere un'email, generare un riassunto — questo è un inconveniente gestibile. In un contesto dove le decisioni riguardano persone reali, diventa un problema strutturale.

Affidarsi a un modello linguistico per una "decisione affidabile" è come chiedere a un sismografo di prevedere un terremoto: lo strumento misura qualcosa di reale, ma non nel modo in cui pensiamo.

La questione non è se l'IA sia utile — lo è, straordinariamente. La questione è se gli stiamo assegnando il tipo di fiducia giusto, basata su una comprensione corretta di cosa fa realmente. E la risposta, troppo spesso, è no.

Perché l'equivoco persiste e perché è pericoloso

L'equivoco persiste per ragioni comprensibili. I modelli moderni producono output che, superficialmente, assomigliano al ragionamento umano. Usano connettivi logici. Costruiscono argomentazioni. Citano premesse e traggono conclusioni. Il formato mima la struttura del pensiero razionale.

Ma mimarne la struttura non significa replicarne il processo. Un attore che recita Amleto non sta davvero considerando il suicidio. Un navigatore GPS non "conosce" la strada — segue un grafo di nodi e archi. E un modello linguistico che produce una spiegazione medica coerente non sta "ragionando sulla salute del paziente" — sta generando la sequenza testuale più plausibile dato il prompt.

Il pericolo è duplice. Da un lato, rischiamo di delegare a questi sistemi responsabilità che richiedono comprensione genuina — e di fidarci dei risultati senza verificarli. Dall'altro, investiamo enormi aspettative e risorse in una direzione che potrebbe non portare dove pensiamo: costruire sistemi sempre più grandi e potenti nella speranza che la comprensione emerga spontaneamente dalla scala.

La domanda giusta da porsi

Dijkstra non stava dicendo che i computer siano inutili, né che la domanda sull'intelligenza artificiale sia priva di senso. Stava dicendo che la domanda mal posta è peggio dell'assenza di domanda, perché orienta la ricerca nella direzione sbagliata.

La domanda utile non è "l'IA può pensare?" ma "in quali compiti questi sistemi producono output affidabili, e in quali no? Dove la loro struttura statistica è uno strumento potente, e dove diventa pericolosamente inadeguata?"

Rispondere a questa domanda richiede che smettiamo di proiettare sul calcolo le categorie del pensiero — e che iniziamo a valutare l'IA per quello che è: uno strumento di straordinaria utilità in molti domini, e di straordinario rischio quando si pretende che faccia ciò per cui non è stato progettato.

Il sottomarino è una macchina meravigliosa. Non nuota. E va benissimo così — a patto di sapere cosa stiamo mettendo in acqua.

Cosa succede davvero dentro un modello linguistico

Il test di Turing non era ciò che crediamo

Il problema delle decisioni affidabili

Perché l'equivoco persiste e perché è pericoloso

La domanda giusta da porsi

Potrebbero interessarti

Lascia un commento