OpenAI potenzia la sicurezza di ChatGPT: cosa cambia per le PMI italiane
Cosa è successo
Il 18 maggio 2026 OpenAI ha rilasciato un aggiornamento significativo dei sistemi di sicurezza di ChatGPT, mirato a tracciare e valutare il rischio in conversazioni considerate sensibili. Come riportato da EdTech Innovation Hub (fonte), introduce una “risk‑score” calcolata in tempo reale per ogni scambio di testo. La score è una misura numerica (da 0 a 1) che indica la probabilità che la conversazione contenga contenuti potenzialmente pericolosi: dati personali non protetti, consigli finanziari non verificati, informazioni mediche sensibili o linguaggio discriminatorio.
Il nuovo algoritmo combina due approcci principali: (1) un modello di classificazione basato su transformer, addestrato su milioni di esempi di abuso linguistico, e (2) un database dinamico di pattern di disinformazione aggiornato quotidianamente da un team di esperti di policy. Quando la risk‑score supera una soglia predefinita, ChatGPT può intraprendere una delle seguenti azioni:
- Avviso all'utente – visualizza un messaggio che invita a riformulare la domanda.
- Limitazione della risposta – fornisce una risposta più generica o taglia parti potenzialmente rischiose.
- Escalation a revisione umana – invia la conversazione a un moderatore umano per una valutazione finale.
Questa architettura consente anche di esportare i log delle risk‑score per audit di compliance, una funzionalità finora assente nelle versioni precedenti di ChatGPT.
