Il pesce palla è velenoso, ma controllato correttamente diventa una delle prelibatezze più pregiate della cucina giapponese. Un nome perfetto per un prodotto AI che fa esattamente la stessa cosa con i modelli linguistici: li prende tutti, li orchestra con precisione, e tira fuori qualcosa di più buono di qualsiasi ingrediente preso singolarmente.
Sakana Fugu è il nuovo sistema di Sakana AI, startup fondata a Tokyo nel 2023 da ex ricercatori di Google DeepMind e Google Brain. E quello che hanno costruito è concettualmente diverso da qualsiasi cosa abbiamo visto finora.
Non è un modello. È un direttore d’orchestra.
Fugu non è un LLM singolo. È un sistema multi-agente che, per ogni task ricevuto, decide dinamicamente quali modelli attivare, in quale ruolo, e come farli collaborare. La struttura deriva da due paper pubblicati a ICLR 2026:
- TRINITY: un coordinatore leggero che assegna ai modelli i ruoli di Thinker (pensatore), Worker (esecutore) e Verifier (verificatore)
- Conductor: un sistema addestrato con reinforcement learning che impara strategie di coordinamento in linguaggio naturale
La chiave è che nessun essere umano ha progettato le strategie di collaborazione. Il sistema le ha imparate da solo.
I numeri che fanno alzare le sopracciglia
Fugu è disponibile in due versioni — Fugu e Fugu Ultra — e i benchmark pubblicati da Sakana AI sono notevoli:
| Benchmark | Fugu Ultra | Opus 4.8 | Gemini 3.1 Pro | GPT 5.5 |
|---|---|---|---|---|
| SWE Bench Pro | 73.7 | 69.2 | 54.2 | 58.6 |
| TerminalBench 2.1 | 82.1 | 74.6 | 70.3 | 78.2 |
| LiveCodeBench | 93.2 | 87.8 | 88.5 | 85.3 |
| Humanity’s Last Exam | 50.0 | 49.8 | 44.4 | 41.4 |
| GPQA-D | 95.5 | 92.0 | 94.3 | 93.6 |
E la cosa più sorprendente: Sakana AI afferma esplicitamente che Fugu si mette spalla a spalla con Fable 5 e Mythos Preview — i modelli più potenti di Anthropic — pur non avendoli nel proprio pool (non essendo pubblicamente accessibili).
I casi d’uso concreti che convincono
I benchmark sono una cosa. Ma i test qualitativi pubblicati sono ancora più impressionanti:
Rubik’s Cube da zero: Fugu Ultra ha scritto un solver in Python puro (senza librerie) che ha risolto 300 cubi casuali con una media di 19.72 mosse. I modelli concorrenti o si sono schiantati (0/300 soluzioni) o erano marginalmente peggiori.
Lettura di manoscritti giapponesi del 1600: dato un manoscritto in scrittura kana dispersa (chirashigaki), Fugu Ultra ha ricostruito l’ordine di lettura con un NED di 0.80 contro il 0.24 del miglior concorrente. Un task che mette in difficoltà anche gli esperti di paleografia giapponese.
AutoResearch su GPU H100: in 14 ore e 123 esperimenti, Fugu Ultra ha autonomamente migliorato le istruzioni di training di un modello GPT, raggiungendo il miglior BPB medio tra tutti i concorrenti.
Trading su 50 settimane: partendo da $10.000, Fugu Ultra ha ottenuto un ritorno medio del +19.43% contro il <15% di tutti gli altri modelli.
Il dettaglio che cambia tutto per le aziende europee
C’è una nota sul sito di Sakana Fugu che vale la pena leggere con attenzione:
“Frontier capability without the risk of export controls.”
Fugu è un sistema giapponese. Non è soggetto ai controlli sulle esportazioni USA che limitano l’accesso ai modelli americani più avanzati in certi contesti regolatori. Per aziende europee o asiatiche che operano in settori sensibili, questo non è un dettaglio secondario.
Detto questo, c’è un’altra nota importante: Fugu non è al momento disponibile nell’UE/EEA, mentre Sakana AI lavora alla compliance GDPR. Quindi per ora, per i nostri utenti europei, è un prodotto da tenere d’occhio — non ancora da usare.
Cosa significa per il mondo dell’AI enterprise
Fugu conferma una direzione che stiamo vedendo prendere forma sempre più chiaramente: il futuro non è il modello più grande, ma l’orchestrazione più intelligente.
L’approccio di Sakana AI — insegnare al sistema a coordinare agenti invece di progettare manualmente i workflow — è lo stesso principio che spiega perché AIDeskPro ha introdotto il fallback automatico tra provider. Non si tratta di scegliere il modello migliore in assoluto. Si tratta di avere il sistema giusto che fa la scelta giusta al momento giusto.
Seguiremo Sakana Fugu con grande attenzione. Quando arriverà in Europa, sarà una conversazione interessante.
Fonte originale: Sakana Fugu — sakana.ai

