Tempo di lettura: 3 minuti

L’AI di oggi è al suo minimo storico, peggio di così non potrà mai essere. E’ questo è straordinario!

Lo stupore per la velocità con cui, mese dopo mese, escono novità nell’ambito tecnologico, specificamente legate al tema delle AI, ci permette di immaginare in prospettiva un futuro assai florido.

Se vogliamo fare un paragone pensiamo a com’era fatta la primissima bicicletta.

 

Non aveva i pedali, credo sterzasse a malapena, eppure fu accolta come un mezzo futuristico. È quasi difficile da credere per noi che conosciamo le biciclette di oggi, ma quello fu un momento decisivo e quasi tutti se ne accorsero. Credo convintamente che le AI di oggi siano paragonabile a quella bicicletta.

E allora, in prospettiva, sono ancora più affascinato da quanto scopro oggi. L’ultimo ritrovato nel mondo AI è infatti il modello ChatGPT o1 (detto o one, appena rilasciato nella versione preview, con solo 30 richieste al mese disponibili). Questo modello è sbalorditivo rispetto al precedente che era uscito solo qualche mese fa. Sbalorditivo dal punto di vista del ragionamento e cercherò di trasmettervelo velocemente con un semplice esempio.

Immaginate vi chieda di rispondermi con una frase all’interno della quale mi dite quante parole avete usato.

Pensando alla risposta dovreste intuire il motivo della scelta del titolo di quest’articolo, perché è proprio quello che dovrete fare per rispondere: spremervi le meningi. Infatti potreste cominciare a rispondermi ragionando al volo mentre parlate e, probabilmente, vi verrebbe fuori una frase del tipo: “ti sto rispondendo con una frase di … parole”. Se non fate le cose con calma sicuramente sparerete un numero approssimativo o addirittura a caso.

Ebbene esattamente in questo modo hanno risposto fino ad ora tutte le AI in commercio, da ChatGPT 4o a Claude 3.5, Gemini, Grok, Llama, Perplexity e Copilot. NESSUNO di questi modelli riesce a darvi una risposta corretta!

Il processo mentale per rispondere correttamente prevede un pensiero più approfondito, più riflessivo, da svolgere su più fasi, un pensiero che deve considerare una riesamina della risposta che si sta per dare con un ragionamento ulteriore.

Questo è quello che riesce a fare ChatGPT o1 ed è l’unica a riuscirci!

Non soffermiamoci solo ed esclusivamente su questa singola questione che può sembrare riduttiva, ma che vuol essere un esempio esplicativo per comprendere il progresso del nuovo modello rispetto ai precedenti. Cerchiamo di capire quanto questa capacità di logica a step (chiamata “Chain-of-Thought”) permetta di ottenere risposte molto più precise. Questo modello compie molti meno errori oltre ad essere notevolmente migliorato in logica.

A seguire vi lascio una serie di domande che ho recuperato in rete per le quali nessun modello, escluso il modello o1 riesce a rispondere correttamente:

– Quante s ci sono nella frase : “Siamo esseri consapevoli delle nostre capacità.”

– Fammi una poesia nella quale alla seconda riga trovo la parola castello, nell’ultima fratello.

– 10 nomi di lunghezza 5 caratteri

– 10 frasi che finiscono con insopportabile

– Rosalba a tre fratelli e 2 sorelle, quante sorelle ha il fratello di alice

– Ho una busta 20×15 posso mettere un foglio 7×17

– Ci sono tre assassini in una stanza, una persona entra e ne uccide uno, quanti assassini restano nella stanza (oppure quanti assassini vivi ci sono nella stanza)

 

Massimiliano Brambilla

Articolo e immagine di copertina realizzate in coautoring con AI.