Salta al contenuto

Accedi Iscriviti

Intelligenza Artificiale

DeepSeek ottiene il voto peggiore in sicurezza

Il modello ha ricevuto 50 attacchi e ha fallito in ognuno di questi.

, and Amir Ati

5 febbraio 2025 . 5:50 AM

2 minuti

I ricercatori di Cisco hanno testato il modello di intelligenza artificiale DeepSeek R1 con 50 attacchi per verificare il comportamento del sistema in situazioni potenzialmente dannose, e il modello ha fallito in ogni tentativo.
DeepSeek R1 è stato messo alla prova utilizzando il dataset HarmBench, progettato per vedere se i modelli di linguaggio evitano comportamenti dannosi: a differenza dei suoi concorrenti, DeepSeek non ha resistito a nessuna delle richieste.
I test di Cisco hanno coperto sei categorie di comportamenti dannosi, tra cui crimini informatici, disinformazione e attività illegali.
Anche Adversa AI, una società di sicurezza, ha testato DeepSeek R1, scoprendo che era estremamente vulnerabile a vari attacchi che inducevano il chatbot a fornire istruzioni su attività illegali.
Il modello DeepSeek ha attirato molte critiche per la gestione della sicurezza dei dati e le risposte a domande sensibili, poiché le linee guida sembrano essere progettate più per evitare questioni politicamente delicate che per bloccare contenuti dannosi.

Questo testo è un riassunto del seguente articolo (eng):

Alternativa in italiano:

Commenti

Più recenti

Tutto il TED contro Sam Altman

Rassegna settimanale

Tutto il TED contro Sam Altman

, and Amir Ati

19 aprile 2025

Plus Iscritti Pubblico

Tutto il TED contro Sam Altman

Editoriale

Tutto il TED contro Sam Altman

, and Amir Ati

19 aprile 2025

Plus Iscritti Pubblico

Una nuova tecnologia giapponese ha creato nuggets di pollo in laboratorio

Scienza

Una nuova tecnologia giapponese ha creato nuggets di pollo in laboratorio

, and Amir Ati

18 aprile 2025

Plus Iscritti Pubblico

ChatGPT o3 e 04-mini, Carne artificiale giapponese, Arma a microonde contro i droni

Rassegna mattutina

ChatGPT o3 e 04-mini, Carne artificiale giapponese, Arma a microonde contro i droni

, and Amir Ati

18 aprile 2025

Plus Iscritti Pubblico