Addestrare un GPT da 20M su ImageNet-1K (classificazione come generazione)
Addestrare un mini VLM decoder-only da 20M su ImageNet-1k: classificazione come generazione!
Devlog personale di esperimenti ed esplorazioni nel mondo misterioso ed affascinante del deep learning.