Mauro Sciancalepore - Notizie AI, Deep Learning e Ricerca

In evidenza

GPT-5.4 di OpenAI: Benchmark, Costi e Capacità Agentiche

GPT-5.4 di OpenAI: Benchmark, Costi e Capacità Agentiche

5 marzo 2026 Leggi l'articolo

Deep Learning

Universal Weight Subspace Hypothesis guida completa

I large language model convergono tutti allo stesso modo?

16 gennaio 2026

TranslateGemma: Guida completa del nuovo modello open per la traduzione AI

TranslateGemma è una suite di modelli aperti basati su Gemma 3, ottimizzati per la traduzione.

15 gennaio 2026

GDPO: NVIDIA risolve il "Reward Collapse" di GRPO nel Multi-Reward RL

GDPO è una nuova tecnica di ottimizzazione per il Multi-reward RL che risolve il "reward collapse" di GRPO, fornendo segnali di addestramento più ricchi e precisi.

10 gennaio 2026

DeepSeek mHC: Spiegazione del paper e codice pytorch

DeepSeek sfrutta la geometria per stabilizzare reti profonde, bilanciando le connessioni per massimizzare le performance senza degradare il segnale.

MambaSeg: segmentazione semantica RGB+Event con Vision Mamba e fusione spazio-temporale DDIM

MambaSeg unisce due encoder Vision Mamba e un modulo DDIM spazio-temporale per segmentazione semantica RGB+event efficiente, SOTA su DDD17/DSEC benchmark.

RadAR: dall’autoregressione sequenziale a quella spaziale per generare immagini più velocemente (paper breakdown)

RadAR riorganizza l'autoregressione in anelli concentrici, genera token in parallelo e corregge errori con nested attention, accelerando drasticamente l'inference.

LIVR: come i token latenti potenziano il ragionamento visivo negli LMM

Migliora il ragionamento visivo dei Large Multimodal Models tramite token latenti e bottleneck visivi, eliminando la necessità di supervisione esplicita.

27 dicembre 2025

Nemotron 3 Nano: L'Ibrido Mamba-Transformer MoE per l'Agentic AI on-device

Modello ibrido Mamba-Transformer MoE da 3.9B parametri che ridefinisce efficienza e reasoning per l'AI on-device.

26 dicembre 2025

Step-DeepResearch: Analisi tecnica del modello che sfida OpenAI con "soli" 32B parametri

Modello da 32B parametri che eguaglia le prestazioni di ricerca di OpenAI e Gemini.

24 dicembre 2025

MAGIC: Ottimizzare il Model Merging tramite la Calibrazione della Magnitude

MAGIC ottimizza il model merging calibrando la magnitude di pesi e feature, training-free

23 dicembre 2025

Esperimenti AI

Addestrare un GPT da 20M su ImageNet-1K (classificazione come generazione)

Addestrare un mini VLM decoder-only da 20M su ImageNet-1k: classificazione come generazione!

17 dicembre 2025

Guida all'Intelligenza Artificiale

Classificazione del Testo con PyTorch: Guida Completa e codice

Addestrare un classificatore testuale in pytorch con 500 righe di python?

22 febbraio 2026

Cos'è PyTorch (2026)? Guida completa e Tutorial da Zero

Pytorch 101

26 gennaio 2026

Cos'è un AutoEncoder? Guida completa

Computer Vision 101

23 gennaio 2026

Cos'è un modello encoder-decoder? Guida completa

Il Transformer originale! Con codice pytorch funzionante.

Notizie AI

GPT-5.4 di OpenAI: Benchmark, Costi e Capacità Agentiche

Google annuncia Gemini 3.1 Flash Lite (Preview)

$0.25 input $1.50 output ..

Alibaba lancia la serie Qwen 3.5 Small: varianti dense da 0.8B a 9B

al livello di gpt 5 nano, gemini 2.5 flash lite ma open source

Alibaba lancia la serie Qwen 3.5 Medium: 35B-A3B, Qwen 3.5-Flash e Qwen 27B

gpt 5.1 mini, open source

25 febbraio 2026

Claude Sonnet 4.6: cos'è, come funziona e novità principali

quasi Opus 4.5 ma più veloce (?)

18 febbraio 2026

Notizie AI Gennaio 2026: Novità dell'ultima settimana (19-25 Gennaio)

Quanto puoi fidarti di un LLM che include pubblicità?

25 gennaio 2026

Liquid LFM-2.5-1.2B-Thinking: Novità e Guida completa

Local AI per tutti!

22 gennaio 2026

Pubblicità su ChatGPT e il nuovo tier Go da 8€

L'inizio di una nuova era pubblicitaria..

16 gennaio 2026

Novità AI e Deep Learning: Resoconto Notizie 5-11 Gennaio 2026

Un bell'inizio 2026 con Qwen3-VL-Embedding e Liquid FM 2.5 !

10 gennaio 2026

ElevenLabs Scribe v2: API per trascrizione Speech-to-Text

Oltre 90 lingue supportate con accuratezza state-of-art

10 gennaio 2026