WiMi lancia QB-Net: Il Deep Learning ibrido riduce i parametri di 30 volte

WiMi lancia QB-Net: Il Deep Learning ibrido riduce i parametri di 30 volte
Condividi:

WiMi Hologram Cloud Inc. ha recentemente svelato QB-Net (Quantum Bottleneck Network), una nuova architettura che segna un punto di svolta nel deep learning ibrido quantistico-classico.

Questa tecnologia integra moduli di calcolo quantistico "lightweight" all'interno della classica architettura U-Net. Il risultato è una riduzione drastica del numero di parametri nel bottleneck layer - fino a 30 volte - mantenendo performance paragonabili alle controparti puramente classiche.

Oltre i limiti dell'hardware attuale

Il vantaggio teorico del quantum computing risiede nella capacità di gestire informazioni ad alta dimensione attraverso la sovrapposizione dei qubits. Questo permette operazioni lineari in spazi vettoriali esponenzialmente più vasti rispetto alle architetture classiche.

Tuttavia, l'hardware quantistico attuale non è ancora maturo per supportare Neural Networks quantistiche su larga scala o per costruire interamente un Transformer quantistico.

WiMi ha aggirato questo ostacolo con un approccio pragmatico: invece di quantizzare l'intero modello, ha sviluppato moduli di potenziamento quantistico specifici. L'idea è rendere il calcolo quantistico una parte preziosa, ma mirata, dell'intero sistema.

Il Quantum Bottleneck: Come funziona

La chiave di volta di QB-Net è l'osservazione che il bottleneck layer nelle reti profonde affronta un problema di espressione ad alta densità di features ad alta dimensione.

Mentre una rete classica necessita di decine di migliaia di parametri per mappare queste caratteristiche, un singolo stato quantistico può teoricamente eguagliare o superare questa potenza espressiva con poche decine di qubits.

Il processo di QB-Net si articola in tre fasi principali:

  • Encoding: Le features classiche vengono mappate in stati quantistici.
  • Quantum Processing: Trasformazione tramite circuiti quantistici ottimizzati.
  • Decoding: Lo stato quantistico viene misurato e ricostruito in un tensor classico tramite un modulo di integrazione e correzione, per poi essere reimmesso nel percorso di decoding della U-Net.

Un modulo Plug-and-Play

Uno degli aspetti più interessanti per i ricercatori e i data practitioners è la natura "plug-and-play" del Modulo Quantistico di Collo di Bottiglia.

QB-Net mantiene intatta la struttura complessiva della U-Net, inclusi l'encoder, il percorso di upsampling e le skip connections. Questo significa che il modulo può essere integrato nei modelli esistenti senza dover stravolgere l'architettura base o modificare il paradigma di training.

Il futuro delle architetture ibride

Il rilascio di QB-Net dimostra che il calcolo quantistico può offrire valore tangibile oggi, senza attendere l'arrivo di hardware futuristici completi.

Le architetture ibride non sono più solo una tecnologia di transizione, ma si candidano a diventare uno standard per l'ottimizzazione strutturale. Sostituendo i blocchi più "costosi" computazionalmente con moduli quantistici efficienti, si apre una nuova via per scalare le prestazioni dei sistemi intelligenti a livello enterprise.

Deep Dive: La matematica del Quantum Encoding

Per comprendere come QB-Net riesca a ridurre i parametri di 30 volte nel bottleneck, dobbiamo guardare a come i dati vengono rappresentati. Nel deep learning classico, le informazioni sono memorizzate come numeri reali in vettori o tensori. Nel quantum computing, operiamo in uno spazio di Hilbert complesso.

Il vantaggio fondamentale è la dimensionalità. Uno spazio di stati quantistici di nn qubits ha una dimensione di 2n2^n. Questo permette una compressione esponenziale delle informazioni, nota come "Amplitude Encoding".

1. Dal Tensore al Qubit (Encoding)

Immaginiamo di avere un vettore di feature classico xx nel livello di collo di bottiglia con NN elementi. Per elaborarlo classicamente, servirebbe una matrice di pesi N×NN \times N.

In un modulo quantistico, possiamo mappare questo vettore xx nell'ampiezza di uno stato quantistico ψ|\psi\rangle utilizzando solo n=log2Nn = \log_2 N qubits.

Formalmente, se il vettore classico è normalizzato tale che xi2=1\sum |x_i|^2 = 1, lo stato quantistico può essere rappresentato come:

ψx=i=0N1xii|\psi_x\rangle = \sum_{i=0}^{N-1} x_i |i\rangle

Dove i|i\rangle sono gli stati di base computazionale (es. 00...0,00...1|00...0\rangle, |00...1\rangle, ecc.). Qui risiede l'efficienza di QB-Net: un vettore di 1024 feature richiede solo 10 qubits per essere rappresentato.

2. Il Circuito Variazionale (Processing)

Una volta che i dati sono nello stato quantistico, il "processing" avviene tramite un Parameterized Quantum Circuit (PQC), che agisce come l'equivalente quantistico di un layer di rete neurale.

Il PQC applica una trasformazione unitaria U(θ)U(\theta), dove θ\theta sono i parametri addestrabili (gli angoli di rotazione delle porte quantistiche). L'operazione è lineare nello spazio degli stati, ma può modellare correlazioni complesse grazie all'entanglement.

L'evoluzione dello stato è descritta da:

ψout=U(θ)ψx|\psi_{out}\rangle = U(\theta) |\psi_x\rangle

A differenza di una rete classica dove i parametri scalano con il quadrato dell'input (N2N^2), in un circuito quantistico ben progettato il numero di parametri θ\theta può scalare polinomialmente o linearmente con il numero di qubits nn, portando al drastico risparmio di memoria citato da WiMi.

3. La Misura (Decoding)

Per reinserire l'informazione nella U-Net classica (il decoder), dobbiamo estrarre informazioni classiche dallo stato quantistico. Questo avviene calcolando il valore atteso di un operatore osservabile, solitamente l'operatore di Pauli ZZ su vari qubits.

L'output yky_k per il kk-esimo qubit sarà:

yk=ψoutZkψouty_k = \langle \psi_{out} | Z_k | \psi_{out} \rangle

Questo valore scalare viene poi passato attraverso una funzione di attivazione o un layer lineare classico per riadattare le dimensioni al tensore richiesto dalla U-Net. Il collo di bottiglia non è solo una compressione dati, ma una proiezione in uno spazio dove le operazioni di convoluzione vengono sostituite da rotazioni unitarie in uno spazio di Hilbert ad alta dimensionalità.

Alcune domande e risposte frequenti su QB-Net

Mauro Sciancalepore - Notizie AI, Deep Learning e Ricerca

Resta aggiornato sulle ultime notizie di Intelligenza Artificiale e Deep Learning. Approfondimenti completi sulla ricerca e stato dell'arte.

© 2026 mauroscia.it
Tutti i diritti riservati.