La matematica, da sempre considerata il regno incontrastato dell'ingegno umano, sta attraversando una fase di profonda trasformazione grazie ai progressi accelerati nell'intelligenza artificiale. Non si tratta di un singolo evento sensazionale, ma di una cascata di risultati concreti che stanno modificando radicalmente il modo in cui la comunità scientifica internazionale concepisce i limiti delle macchine nel campo della ricerca matematica. Negli ultimi mesi, sviluppi inaspettati hanno costretto ricercatori prestigiosi a riconsiderare completamente le loro valutazioni circa i tempi di una possibile superiorità dell'IA su questa disciplina.

Daniel Litt, matematico dell'Università di Toronto, offre un esempio emblematico di questo cambio di prospettiva. Nel marzo 2025 aveva scommesso con un collega che fosse improbabile, con una probabilità di apenas il 25%, che un'intelligenza artificiale potesse produrre articoli matematici di qualità paragonabile ai migliori ricercatori umani entro il 2030. Meno di dodici mesi dopo, ha pubblicamente ammesso sul suo blog di aspettarsi ormai di perdere questa scommessa. Litt riconosce che solo pochi anni addietro i sistemi di intelligenza artificiale risultavano sostanzialmente inadeguati anche per problemi di matematica liceale, mentre oggi affrontano con successo questioni autentiche che emergono nella ricerca quotidiana dei matematici professionisti.

Questa onestà intellettuale è condivisa tra i colleghi di massimo livello. Jeremy Avigad della Carnegie Mellon University ha recentemente dichiarato: "Stiamo esaurendo i nascondigli. Dobbiamo affrontare la realtà che l'intelligenza artificiale dimostrerà teoremi meglio di noi nel prossimo futuro." Il punto di rottura non è stato innescato da un'unica scoperta clamorosa, ma dall'accumularsi di successi tangibili. I sistemi sviluppati da OpenAI e da Google DeepMind hanno ottenuto performance equiparabili a medaglie d'oro alle Olimpiadi Internazionali di Matematica, una competizione di altissimo livello riservata ai migliori studenti di scuole superiori che molti scienziati consideravano irraggiungibile per le macchine. A gennaio scorso, tecnologie analoghe sono state impiegate per affrontare problemi aperti da decenni, formulati dal celebre matematico ungherese Paul Erdős.

Per valutare queste capacità in modo più realistico, Nikhil Srivastava dell'Università della California a Berkeley ha lanciato a febbraio il progetto denominato First Proof. Si tratta di un'iniziativa pensata come un banco di prova credibile per testare effettivamente ciò che i sistemi di intelligenza artificiale sanno fare in ambito matematico. Il progetto ha proposto inizialmente un lotto di dieci quesiti estratti dall'esperienza concreta di lavoro di matematici provenienti da settori disciplinari molto eterogenei. Secondo Srivastava, "si trattava di problemi che erano emersi naturalmente dal nostro operato scientifico. Rappresentavano una gamma tipica di difficoltà: non erano esercizi banali, ma nemmeno quesiti straordinariamente complessi. Lo spettro era veramente variegato." I risultati hanno sorpreso: OpenAI ha annunciato di aver risolto correttamente cinque dei dieci problemi proposti, secondo la valutazione di esperti indipendenti consultati a tale scopo.