Trascrivere la Calligrafia di Grothendieck con l'AI
Come ho scoperto 18.000 pagine di manoscritti matematici scansionati e verificato se possono diventare leggibili con l’AI del giorno d’oggi
Il Matematico dei Matematici
Alexandre Grothendieck nel 1951, 1965 e 2014. Foto di Paulo Ribenboim, Karin Tate e Peter Badge (via Privatdozent).
Durante la mia laurea in matematica all’Università di Groningen, un nome continuava a emergere con una qualità quasi mitica: Alexandre Grothendieck. Sapevo che il suo lavoro sulla geometria algebrica e la teoria delle categorie era fondamentale — il tipo di matematica su cui altri matematici costruiscono intere carriere. Ma non sapevo molto dell’uomo stesso.
Grothendieck (1928–2014) nacque da genitori anarchici che lo lasciarono a trascorrere gran parte degli anni formativi con famiglie affidatarie. Suo padre fu assassinato ad Auschwitz. Mentre sua madre era detenuta, crebbe apolide, nascondendosi dalla Gestapo nella Francia occupata. Nel frattempo, imparò da solo la matematica dai libri — e prima del suo ventesimo compleanno aveva indipendentemente riscoperto una dimostrazione della misura di Lebesgue, una pietra miliare della teoria dell’integrazione.
Più tardi, come stella nascente del mondo matematico francese degli anni ‘50 e ‘60, Grothendieck passò da argomento ad argomento durante i suoi “anni d’oro” (1955–1970), introducendo idee rivoluzionarie ovunque andasse. Poi se ne andò. Per protestare contro la guerra del Vietnam, tenne lezioni di teoria delle categorie nelle foreste intorno ad Hanoi mentre la città veniva bombardata.1
Labatut e il Confine tra Finzione e Realtà
È stato solo quando ho letto Quando abbiamo smesso di capire il mondo di Benjamin Labatut che ho intravisto la persona dietro i teoremi. Il libro di Labatut è un’opera di finzione — o meglio, finzione intrecciata attorno a figure storiche, sfumando il confine tra ciò che è accaduto e ciò che potrebbe essere accaduto.
Il capitolo su Grothendieck era inquietante. Un uomo che rivoluzionò la matematica, poi si ritirò completamente dalla vita accademica. Un pacifista che abbandonò posizioni prestigiose per i finanziamenti militari. Un recluso che trascorse i suoi ultimi decenni in un piccolo villaggio nei Pirenei, riempiendo quaderni con quello che chiamava “La Clef des Songes” (La Chiave dei Sogni).
Ma quanto era vero?
Nella Tana del Coniglio di Wikipedia
Sono andato alla pagina Wikipedia di Grothendieck per separare i fatti dall’immaginazione di Labatut. La maggior parte dei tratti generali era accurata. La rivoluzione matematica. Il risveglio politico. Il ritiro.
E poi ho trovato qualcosa di inaspettato: gli archivi.
Dopo la morte di Grothendieck nel 2014, la sua famiglia ha donato circa 28.000 pagine di manoscritti scritti a mano all’Università di Montpellier. Non erano solo appunti matematici — erano diari, riflessioni filosofiche e sì, “La Clef des Songes”.
Gli archivi sono disponibili online su grothendieck.umontpellier.fr.2
Ho scaricato tutti i 146 PDF disponibili. Quattro gigabyte di pagine scansionate. E poi ho provato a leggerli.
Il Problema: Illeggibilità a Livello Geniale
Grothendieck scriveva in francese, spesso mescolando notazione matematica densa con prosa filosofica. La sua calligrafia è… impegnativa.
Una pagina relativamente semplice: un indice per argomenti di analisi funzionale. Anche qui, testo cancellato e abbreviazioni rendono la trascrizione non banale.
Una pagina più tipica (p.145 dal documento 119): teoria delle categorie con più livelli di annotazioni, note a margine e la notazione caratteristicamente densa di Grothendieck.
Anche per i matematici francofoni, decifrare questi manoscritti è un lavoro lento e meticoloso. Il Centro per gli Studi Grothendieckiani (CSG) li sta trascrivendo manualmente, ma è uno sforzo pluriennale che richiede profonda competenza matematica.
Mi sono chiesto: l’AI moderna potrebbe aiutare?
L’Esperimento
I modelli vision-language (VLM) sono migliorati drasticamente nell’ultimo anno. Gemini, GPT e Claude possono tutti processare immagini e testo insieme. Sono addestrati su enormi quantità di testo scritto a mano e notazione matematica.
Ho costruito una pipeline semplice:
- PDF in immagini: Converti ogni pagina in PNG a 150 DPI
- Trascrizione VLM: Invia l’immagine a un modello con un prompt che chiede una trascrizione fedele in LaTeX
- Output: Memorizza JSON (con metadati) e file LaTeX semplici
Il prompt era minimale:
Can you extract the text from this?
La vera domanda era: quanto sarebbero buoni i risultati?
Risultati: Confronto dei Modelli
Ho testato tre modelli frontier sulle stesse pagine dal documento 119 (uno dei manoscritti che il CSG sta attivamente trascrivendo):
| Modello | Qualità Trascrizione |
|---|---|
| Gemini 3 Pro | ⭐⭐⭐⭐ |
| Claude Opus 4.5 | ⭐⭐⭐ |
| ChatGPT 5.2 | ⭐⭐ |
Test 1: Pagina Indice (Più Semplice)
Questa pagina elenca argomenti di analisi funzionale (N°1 fino a N°7): riordinamenti di funzioni, funzioni di Weyl, misure spettrali, determinanti, disuguaglianze degli anelli di operatori.
Gemini 3 Pro:

Gemini ha fornito:
- Trascrizione completa in francese
- Traduzione inglese
- Note sulla calligrafia identificando sezioni cancellate
- Contesto matematico (notando che $(A \in \bar{a})$ si riferisce all’appartenenza all’algebra di operatori)
Claude Opus 4.5:

Claude ha prodotto output pulito con notazione barrata appropriata per il testo cancellato, formattazione strutturata e identificazione degli argomenti. Analisi contestuale leggermente inferiore rispetto a Gemini.
Test 2: Pagina Densa di Teoria delle Categorie (Più Difficile)
Questa è la pagina 145 dal documento 119 — teoria delle categorie densa con più livelli di annotazioni, note a margine e correzioni.
Gemini 3 Pro:

Gemini ha gestito questo in modo impressionante:
- Identificato il contenuto matematico (equivalenza categoriale tra spazi topologici e mappature specifiche)
- Preservato la notazione LaTeX: $\mathcal{C}$, $f: X \to Y$, $\underline{\text{Hom}}(y, y’)$
- Colto l’affermazione di equivalenza: $\mathcal{C} \rightleftarrows_{\approx} \mathcal{C}’$
- Notato la domanda in fondo: “Quelles quantités/qualités obtient-on avec des feuilletages ???”
- Letto il testo verticale a margine
ChatGPT 5.2 Thinking:

ChatGPT (su una pagina similmente difficile) ha faticato significativamente:
Sei C eine C*-Algebra, [illegible] und [illegible] ...
[illegible] linearen [illegible] T_V [illegible] ...
Molti marcatori [illegible]. Il modello è stato onesto sui suoi limiti — “Non voglio fingere di poter recuperare il testo completamente esatto” — ma ha prodotto output molto meno utilizzabile.
Il Verdetto
Gemini 3 Pro gestisce anche le pagine più impegnative con notevole accuratezza. Fornisce non solo trascrizione ma comprensione — identificando concetti matematici, traducendo e notando caratteristiche strutturali come il testo cancellato.
Claude Opus produce output pulito e ben formattato ed è onesto sull’incertezza, ma offre contesto matematico leggermente inferiore.
ChatGPT 5.2 fatica con la calligrafia difficile ed è più conservativo, risultando in trascrizioni meno complete. Ha anche impiegato quasi 10 minuti per pagina rispetto a circa 1 minuto per Gemini e Claude.
Una Nota su “Comprensione” vs. Confabulazione
Qualcosa di sorprendente: i modelli riconoscono che questo è il lavoro di Grothendieck senza che glielo si dica. Il prompt era semplicemente “Can you extract the text from this?” — eppure l’output di Gemini inizia con “Questa trascrizione copre gli appunti scritti a mano dalla pagina 145 degli archivi di Grothendieck.” Il modello ha inferito l’autore dallo stile della calligrafia, dal contenuto matematico e forse dalla struttura del documento.
Questo ha due facce. Lo stesso pattern-matching che permette il riconoscimento può produrre confabulazione dal suono sicuro. Parte di ciò che i modelli producono è probabilmente corretto; parte è probabilmente allucinata, specialmente per passaggi pesantemente cancellati o ambigui. I modelli non sempre segnalano l’incertezza.
Per il lavoro di trascrizione, questo è comunque enormemente utile — un esperto umano che revisiona l’output dell’AI è molto più veloce della trascrizione da zero. Ma significa che ogni trascrizione ha bisogno di verifica, non solo controlli a campione. Un controllo incrociato sistematico con esperti di dominio aiuterebbe a quantificare l’accuratezza e potrebbe svilupparsi in un lavoro collaborativo più strutturato tra trascrittori AI e umani.
Cosa Ho Imparato
- I VLM sono sorprendentemente bravi con il testo scritto a mano — anche scritture impegnative come quella di Grothendieck
- La scelta del modello conta enormemente — Gemini 3 Pro ha superato significativamente le alternative sulle pagine difficili
- La notazione matematica è la parte più difficile — ma i modelli migliori la gestiscono meglio di quanto mi aspettassi
- Il collo di bottiglia non è l’AI, è la verifica — servono ancora esperti di dominio per confermare la correttezza
Attualmente sto contattando l’Istituto Grothendieck per saperne di più sul loro interesse per la trascrizione assistita dall’AI e per comprendere meglio l’accuratezza effettiva di questi output rispetto alle trascrizioni degli esperti.
Prova Tu Stesso
Il codice di trascrizione è open source: github.com/ivan-gentile/grothendieck-ocr
pip install -r requirements.txt
python transcribe.py 119.pdf --model gemini-flash --pages 1-10
Gli archivi stessi sono liberamente disponibili su grothendieck.umontpellier.fr.
Se lavori sulla trascrizione di manoscritti matematici o OCR per testo scritto a mano, mi piacerebbe sentirti. Contattami su LinkedIn.
Letture Correlate
- Trascrizioni CSG - il progetto di trascrizione manuale
- Quando abbiamo smesso di capire il mondo - il brillante libro di Labatut
- Il paper di Olivia Caramello sui Topos - per chi è incline alla matematica (aggiunto alla mia lista di lettura personale!)
Tradotto in italiano da Claude Opus 4.5 e revisionato personalmente
Footnotes
-
Questo fatto straordinario viene dalla sua pagina Wikipedia. ↩
-
Il sito di Montpellier ha un certificato SSL scaduto, quindi il browser potrebbe avvisarti. Il sito è legittimo — è gestito dalla biblioteca universitaria. L’Istituto Grothendieck in Piemonte, Italia lo collega anche dal loro progetto di trascrizione su csg.igrothendieck.org. ↩