Phi-4-mini-instruct: scheda tecnica e usi

Cos'è Phi-4-mini-instruct

Phi-4-mini-instruct è un piccolo modello di linguaggio (SLM, Small Language Model) sviluppato da Microsoft all'interno della famiglia Phi-4. Con soli 3,8 miliardi di parametri, rappresenta una delle soluzioni più compatte tra i modelli aperti di recente generazione. È rilasciato con licenza MIT, che ne consente l'uso commerciale, la modifica e la redistribuzione con pochi vincoli. La versione "instruct" è stata ottimizzata per seguire istruzioni, rispondere in formato conversazionale e gestire chiamate di funzione.

L'obiettivo di Phi-4-mini è offrire prestazioni tipiche di modelli di taglia superiore mantenendo un'impronta hardware ridotta. Nei benchmark pubblicati da Microsoft sul repository ufficiale, il modello ottiene risultati paragonabili a sistemi con circa il doppio dei parametri su compiti di ragionamento, matematica e programmazione. Questo lo rende interessante per chi deve integrare l'intelligenza artificiale in applicazioni reali senza affidarsi esclusivamente a grandi API cloud.

Come funziona

Il cuore di Phi-4-mini-instruct è un transformer decoder-only denso. Rispetto alla generazione precedente Phi-3.5-mini, introduce tre cambiamenti architetturali principali: un vocabolario ampliato a circa 200.000 token, l'attenzione grouped-query (GQA) per ridurre l'occupazione di memoria durante l'inferenza e l'embedding condiviso tra input e output. Il contesto massimo è di 128.000 token, una cifra elevata per un modello di queste dimensioni e utile per analizzare documenti lunghi, riassumere testi estesi o mantenere conversazioni con molti turni.

L'addestramento è avvenuto su circa 5 trilioni di token, combinando documenti pubblici filtrati per qualità, dati sintetici di tipo didattico e conversazioni in formato chat. Microsoft ha impiegato 512 GPU NVIDIA A100-80G per circa 21 giorni. Dopo il pre-training, il modello è stato sottoposto a supervised fine-tuning (SFT) e direct preference optimization (DPO) per migliorare il rispetto delle istruzioni, la veridicità delle risposte e l'helpfulness. Il cutoff dei dati pubblici è giugno 2024.

Phi-4-mini-instruct (Microsoft): SLM open da 3,8B parametri

Cos'è Phi-4-mini-instruct

Come funziona

🤔 Hai domande su questo argomento?

Continua a leggere

Veo 3 (Google): modello di generazione video AI con audio nativo

Stable Video Diffusion (Stability AI): image-to-video open

A cosa serve

Perché conta per founder, PMI e agenzie italiane

Limiti e accorgimenti

Dove trovarlo e come usarlo

Sora (OpenAI): modello di generazione video da testo e immagini

Sana (NVIDIA): modello open di sintesi immagini ad alta risoluzione