Deep Learning

Guide complete e analisi dei paper scientifici più recenti. Resta sempre aggiornato sulle innovazioni che definiscono lo stato dell'arte.

Universal Weight Subspace Hypothesis guida completa

I large language model convergono tutti allo stesso modo?

16 gennaio 2026

TranslateGemma: Guida completa del nuovo modello open per la traduzione AI

TranslateGemma è una suite di modelli aperti basati su Gemma 3, ottimizzati per la traduzione.

15 gennaio 2026

GDPO: NVIDIA risolve il "Reward Collapse" di GRPO nel Multi-Reward RL

GDPO è una nuova tecnica di ottimizzazione per il Multi-reward RL che risolve il "reward collapse" di GRPO, fornendo segnali di addestramento più ricchi e precisi.

10 gennaio 2026

DeepSeek mHC: Spiegazione del paper e codice pytorch

DeepSeek sfrutta la geometria per stabilizzare reti profonde, bilanciando le connessioni per massimizzare le performance senza degradare il segnale.

3 gennaio 2026

MambaSeg: segmentazione semantica RGB+Event con Vision Mamba e fusione spazio-temporale DDIM

MambaSeg unisce due encoder Vision Mamba e un modulo DDIM spazio-temporale per segmentazione semantica RGB+event efficiente, SOTA su DDD17/DSEC benchmark.

2 gennaio 2026

RadAR: dall’autoregressione sequenziale a quella spaziale per generare immagini più velocemente (paper breakdown)

RadAR riorganizza l'autoregressione in anelli concentrici, genera token in parallelo e corregge errori con nested attention, accelerando drasticamente l'inference.

1 gennaio 2026

LIVR: come i token latenti potenziano il ragionamento visivo negli LMM

Migliora il ragionamento visivo dei Large Multimodal Models tramite token latenti e bottleneck visivi, eliminando la necessità di supervisione esplicita.

27 dicembre 2025

Nemotron 3 Nano: L'Ibrido Mamba-Transformer MoE per l'Agentic AI on-device

Modello ibrido Mamba-Transformer MoE da 3.9B parametri che ridefinisce efficienza e reasoning per l'AI on-device.

26 dicembre 2025

Step-DeepResearch: Analisi tecnica del modello che sfida OpenAI con "soli" 32B parametri

Modello da 32B parametri che eguaglia le prestazioni di ricerca di OpenAI e Gemini.

24 dicembre 2025

MAGIC: Ottimizzare il Model Merging tramite la Calibrazione della Magnitude

MAGIC ottimizza il model merging calibrando la magnitude di pesi e feature, training-free

23 dicembre 2025

4D-RGPT: Migliorare la comprensione 4D nei Multimodal LLM

4D-RGPT integra la comprensione 4D a livello di regione nei Multimodal LLM tramite Perceptual Distillation, definendo nuovi standard su R4D-Bench.

22 dicembre 2025

Sigma-MoE-Tiny guida completa: Efficienza e Performance con 500M parametri

Solo 1 esperto attivo?!

19 dicembre 2025

T5Gemma 2 guida completa: leggere e capire a lungo raggio

18 dicembre 2025

Bolmo guida completa: Byte-Level Language Model efficace

18 dicembre 2025

Gemini 3 Flash guida completa: cos'è, come funziona e perché conta davvero

17 dicembre 2025

QwenLong-L1.5 guida completa: post-training per long-context reasoning e memory management