Questa pagina contiene un riassunto del seguente articolo: newatlas.com (eng)
Riassunto
Un team di ricercatori ha pubblicato uno studio in cui si dimostra che GPT-4 è capace di sfruttare autonomamente le vulnerabilità N-day, falle di sicurezza già note ma ancora senza soluzione.
Fornito di una lista di Common Vulnerabilities and Exposures (CVE), GPT-4 è riuscito a sfruttare l'87% delle CVE di gravità critica autonomamente.
Recentemente, lo stesso gruppo ha pubblicato uno studio di follow-up in cui annunciano di essere riusciti ad hackerare vulnerabilità zero-day, ovvero quelle sconosciute, utilizzando agenti di modello linguistico grande (LLM) autonomi e auto-propaganti attraverso un metodo di pianificazione gerarchica con agenti specifici per il compito (HPTSA).
Questa tecnica assegna un "agente di pianificazione" che supervisiona l'intero processo e lancia numerosi "sotto-agenti" specifici per i compiti.
Simile a un team di sviluppo software di Cognition Labs denominato Devin AI, HPTSA è risultata essere il 550% più efficiente di un singolo LLM nello sfruttamento di vulnerabilità reali, riuscendo a hackerare 8 delle 15 vulnerabilità zero-day contro le 3 di un singolo LLM.
Daniel Kang, uno dei ricercatori, ha specificato che in modalità chatbot, GPT-4 è "insufficiente per capire le capacità di LLM" e non può hackerare nulla autonomamente.
Attendibilità fonte
New Atlas è considerato una fonte "Pro-Science" da Media Bias/Fact Check, il che significa che pubblica notizie scientifiche basate su prove credibili e seguendo il metodo scientifico. La copertura è minimamente faziosa e si concentra su avanzamenti tecnologici, scientifici e culturali. New Atlas non ha registrato fallimenti nel fact-checking negli ultimi cinque anni.
L'attendibilità della fonte è stata analizzata tramite Media Bias/Fact Check.
I testi presenti all'interno di questa pagina sono stati inizialmente generati tramite intelligenza artificiale e poi revisionati e corretti a mano.